统计学公式汇总

更新时间:2024-01-11 03:13:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

统计学公式汇总

(1) αβδμσνπρυt u F X s ?2 X?X2?????Xn(2) 均数(mean):X?1?nXn为各观察值。

(3) 几何均数(geometric mean, G):

?X 式中X表示样本均数,X,X,

n1

2

lgXlgX1?lgX2?????lgXn?1?G?X1?X2???Xn?lg()?lg()式中

nnn?1G表示几何均数,X1,X2,Xn为各观察值。

(4) 中位数(median, M)

n为奇数时,M?X(n?1)2n()2

n为偶数时,M?[X?Xn(?1)2]/2

式中n为观察值的总个数。

(5) 百分位数 Px?L?i(n?x%??fL) 式中L为Px所在组段的下限,fx为其频fx数,i为其组距,?fL为小于L各组段的累计频数。

(6) 四分位数(quartile, Q) 第25百分位数P25,表示全部观察值中有25%(四分之一)

的观察值比它小,为下四分位数,记作QL;第75百分位数P75,表示全部观察值中有25%(四分之一)的观察值比它大,为上四分位数,记作QU。

(7) 四分位数间距 等于上、下四分位数之差。

?(X??)2(8) 总体方差 ??

N2?(X??)2(9) 总体标准差 ??

N?(X?X)2?X2?(?X)2/n(10) 样本标准差 s? ?n?1n?1(11) 变异系数(coefficient of variation, CV) CV?s?100% X(12) 样本均数的标准误 理论值?X??n 估计值sX?sn 式中σ为总体标准差,s

为样本标准差,n为样本含量。

(13) 样本率的标准误 理论值?p??(1??)n 估计值sp?p(1?p) 式中π为总n体率,p为样本率,n为样本含量。

(14) 总体率的估计:正态分布法,(p?u??p(1?p)/n,p?u??p(1?p)/n) 式

snsn中p为样本均数,s为样本标准差,n为样本含量。

(15) 总体均数的估计t分布法:(X?t?,??,X?t?,??) 式中X为样本均数,s

为样本标准差,n为样本含量,ν为自由度。 (16) 总体均数的估计u分布法:

总体标准差σ未知但较大时,(X?u??s为样本标准差,n为样本含量。

总体标准差σ已知时,(X?u??总体标准差,n为样本含量。

(17) 样本均数与总体均数比较的t检验:t?sn,X?u??sn) 式中X为样本均数,

?n,X?u???n) 式中X为样本均数,σ为

X??0s/n ??n?1 式中X为样本均数,

?0为欲比较的总体均数,s为样本标准差,n为样本含量,ν为自由度。

(18) 样本均数与总体均数比较的u检验: u?X??0s/n 式中X为样本均数,?0为欲

比较的总体均数,s为样本标准差,n为样本含量。

(19) 样本均数与总体均数比较的u检验:u?X??0?/n 式中X为样本均数,?0为欲比

较的总体均数,σ为总体标准差,n为样本含量。

(20) 配对设计差值的符号秩和检验正态近似法公式:

u?T?n(n?1)/4n(n?1)(2n?1)?(t?tj)?24483j 式中T为秩和,求秩和方法:差值d=(X-

μ0);依差值的绝对值从小到大编秩;差值为0者,舍去不计;如果差值相等,取平均秩次;分别求出正、负秩次之和T(+)、T(-);T为二者绝对值较小者;n为样本含量,但不包括差值等于0者;tj(=1,2,···)为第j个相同差值的个数。

t?(21) 配对设计两样本均数比较的t检验:

d?0sd/n ??n?1 式中d为差值d的均数,

sd为差值d的标准差,n为样本含量(即样本对子数),差值d=各对子数据之差(含正负号!),ν为自由度。

(22) 成组设计两样本均数比较的t检验:

t?X1?X2?sX1?X2X1?X2?X21?(?X1)/n1??X?(?X2)/n211(?)n1?n2?2n1n22222

??n1?n2?2 式中X1和X2分别为两个样本均数, n1和n2为两个样本含量,

ν为自由度。

(23) 样本率与总体率的比较:未校正的正态近似法u?X?n?0n?0(1??0) 或

u?p??0?0(1??0)/n式中X为样本阳性数,π0为欲比较的总体率,p为样本率, n

为样本含量。

(24) 样本率与总体率的比较:校正的正态近似法u?|X?n?0|?0.5n?0(1??0) 或

u?|p??0|?1/2n?0(1??0)/n式中X为样本阳性数,π0为欲比较的总体率,p为样本率, n

为样本含量。

(25) 样本率与总体率的比较:直接计算概率法:首先按照二项分布的原理计算从0到n

各个X的概率值P(X)=

n!(1??0)n?X?0X。左单侧:PL表示从0到Xs

X!(n?X)!的累计概率;右单侧:PR 表示从Xs到n的累计概率;单侧概率P=MIN(PL, PR);双侧概率P的计算方法有三种:A,单侧概率乘2;B,当X大于nπ0时,双侧概率=P(≥X)+P(≤(2 nπ0-X));当X小于nπ0时,双侧概率=P(≤X)+P(≥(2 nπ0-X));C,将P(X)≤P(Xs)的各个概率值相加,即得双侧累计概率,即P=∑P(X),X满足条件P(X)≤P(Xs)。式中X为样本阳性数,π0为欲比较的总体率,Xs为样本阳性数, n为样本含量。

(26) 两个样本率的比较:正态近似法u?p1?p2s?s2p12p2?p1?p2p1(1?p1)p2(1?p2)?n1n2 式

中p1和p2分别为两个样本率, n1和n2为两个样本含量。

(27) 两个样本率的比较:正态近似法u?p1?p2pc(1?pc)(11?)n1n2,pc?n1p1?n2p3

n1?n2式中p1和p2分别为两个样本率, n1和n2为两个样本含量。

(A?T)2(28) 四格表?检验:??? ν=(行数-1)(列数-1)式中A为实际

T22频数(actual frequency),T为理论频数(theoretical frequency),TRC?nRnC 式中nTRC表示R行(row)C列(column)的理论频数,nR为相应行的合计值,nC为相应列的合计值,n为总例数,ν为自由度。

(ad?bc)2n(29) 四格表?检验专用公式:?? ν=(行数-1)(列

(a?b)(c?d)(a?c)(b?d)22数-1)式中a,b,c,d为四格表的四个实际频数,n为总例数,ν为自由度。

(|ad?bc|?n/2)2n(30) 四格表?值的校正公式:?? ν=(行数-1)(列

(a?b)(c?d)(a?c)(b?d)22数-1) 式中a,b,c,d为四格表的四个实际频数,n为总例数,ν为自由度。

A2(31) 行×列表?检验公式:??n(?(C-1)式中A为?1) ν=(R-1)

nRnC22实际频数(actual frequency),nR为相应行的合计值,nC为相应列的合计值,n为总例数,,R为行数,C为列数,ν为自由度。

(32) 行×列表?检验公式:??n(22??nmi?1j?1iRCAij(C-1)式中Aij?1) ν=(R-1)

j为实际频数(actual frequency),ni为相应行的合计值,mj为相应列的合计值,n为总例数,R为行数,C为列数,ν为自由度。

(33) 四格表的确切概率法:P?(a?b)!(c?d)!(a?c)!(b?d)! 式中a,b,c,d为

a!b!c!d!n!四格表的四个实际频数,n为总例数。取表原则可分为“差数极端法”和“概率极端法”。多数情况下,二者所得结果一致,但个别情况下,所得结果不同。一般认为,“概率极端法”最准确。

(b?c)2(34) 配对四格表的?检验:??,ν=1,式中b,c为结果不一致的对子数。

b?c22(35) 配对四格表的?检验校正公式:??致的对子数。

(36) 矩法正态性检验

22(b?c?1)2b?c,ν=1,式中b,c为结果不一

n?fX3?3?fX?fX2?2(?fX)3/n g1?(n?1)(n?2){?fX2?(?fX)2/n]/(n?1)}3/2(n?1)[n?fX4?4?fX?fX3?6(?fX)2?fX2/n?3(?fX)4/n2]3(n?1)2g2??222(n?2)(n?3)(n?1)(n?2)(n?3){[?fX?(?fX)/n]/(n?1)}

?g16n(n?1)?(n?2)(n?1)(n?3)

?g224n(n?1)2 ?(n?3)(n?2)(n?3)(n?5)f为相同X的个数,n为样本例数。 ug1?g1/?g1 ug2?g2/?g2 式中X为变量值,

(37) 二项分布的概率

A. 恰有X例阳性的概率,记为P(X)

P(X)?(n1??)n?X?X,X=0,1,2,?,n X)((nX)?n!

X!(n?X)!式中X为阳性数,π为总体阳性率,n为样本例数,!为阶乘符号。 B. 最多有k例阳性的概率,记为P(X≤k) P(X≤k)=

?P(X) X=0,1,2,?,n

0kC. 最少有k例阳性的概率,记为P(X≥k) P(X≥k)=

?P(X) X=0,1,2,?,n

kn(38) Poisson分布的概率

A. 恰有X例阳性的概率,记为P(X)

P(X)?e???(?X/X!),X=0,1,2,?,n

式中μ=nπ,为Poisson分布的总体均数,X为单位时间(或面积、容积等)某事件发生数,e为自然对数的底。

式中X为阳性数,π为总体阳性率,n为样本例数,!为阶乘符号。 B. 最多有k例阳性的概率,记为P(X≤k) P(X≤k)=

?P(X) X=0,1,2,?,n

0kC. 最少有k例阳性的概率,记为P(X≥k) P(X≥k)=

(39) Poisson分布样本均数与总体均数比较 u??P(X) X=0,1,2,?,n

knX???。式中X为样本阳性数,λ为总

体均数。注意:样本的观察单位数应等于总体的观察单位数,否则,应根据二者观察单位数之比相应调整λ。

?X(40) Poisson分布两个样本均数比较 u?1n1??Xn22n22?Xn121X??。式中∑X1为第一个样本阳

2性数之和,n1为第一个样本的观察单位数之和,∑X2为第二个样本阳性数之和,n2

为第二个样本的观察单位数之和。

(41) Pearson相关系数计算公式:r??(X?X)(Y?Y)?(X?X)?(Y?Y)ii2ii2?lXYlXXlYY

(42) Pearson列联系数计算公式:P??2??n2 式中n为样本含量。

(43) 关联系数:r?(44)

?2n 式中n为样本含量。

?X(40) Poisson分布两个样本均数比较 u?1n1??Xn22n22?Xn121X??。式中∑X1为第一个样本阳

2性数之和,n1为第一个样本的观察单位数之和,∑X2为第二个样本阳性数之和,n2

为第二个样本的观察单位数之和。

(41) Pearson相关系数计算公式:r??(X?X)(Y?Y)?(X?X)?(Y?Y)ii2ii2?lXYlXXlYY

(42) Pearson列联系数计算公式:P??2??n2 式中n为样本含量。

(43) 关联系数:r?(44)

?2n 式中n为样本含量。

本文来源:https://www.bwwdw.com/article/eoso.html

Top