卡方分布及其它分布
更新时间:2023-12-22 19:24:01 阅读量: 教育文库 文档下载
卡方分布
一、 卡方分布的定义:
若n个相互独立的随机变量ξ1,ξ2,…,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和∑ξi∧2构成一新的随机变量,其分布规律称为χ2(n)分布(chi-square distribution),其中参数 n 称为自由度。
二、 卡方分布的性质::
(1) (可加性) 设Yi~?2ni,?i,i?1,?,k,且相互独立,则 Y1???Yk~这里n?2?n,?,
?n,????.
ii22Va(r?n,?)?2n?4?.
(2) E(?n,?)?n??,
证明 (1)根据定义易得。 (2)设Y~2Y可表示为 ?n,?,则依定义,22 Y?X12???Xn?1?Xn,
其中Xi~N(0,1),i?1,?,n?1,Xn~N(?,1),且相互独立,于是
E(Y)??E(Xi2),
i?1n(1)
Var(Y)??Var(Xi2).i?1n(2)因为
E(Xi2)?Var(Xi)?E(Xi)2???1,i?1,?,n?1,
i?n.1??,?代入(1),第一条结论可得证。直接计算可得
4EX?3,i?1,?,n?1, i
4EXn??2?6??3.于是
Var(Xi)?EXi?(EXi)?3?1?2,2422 Var(Xn)?EXn?(EXn)?2?4?.
2422i?1,?,n?1,
1
代入(2)便证明了第二条结论。
三、 卡方分布的概率密度函数:
nx?1??122xe,当x?0?n?2?n? fx2?x???2????2???0,其他?设随机变量X1,....Xn相互独立且都服从N(0,1)。现在来推导随机变数 ?^2??1^2?.....??n^2的分布。11??1,??n?的密度函数为?^??x1^2???xn^2?2?2n?^n
2?当z?o时,P???当z?0时,P??2?z??P?1???Xn?z?022221????z???P???????Xn?z??Dz??222??1?2n?2en-1?x1^2???xn^2?2d?x
其中Dx为n维x空间内由不等式x1??xn?z所定的区域。
即,Dz为n维x空间内以坐标原点为球心、z为半径的球面所围成的区域(边界不在内)
可以利用极坐标来计算这积分。令 ?x1?rsin?1sin?2?sin?n?1?x?rcos?sin??sin?212n?1?? ????????????x?rcos??2sin?nn?1?n?1??xn?rcos?n?1
与这变换相应的函数行列式为:
n-1??x1,?,xn???r?????? ??r,?1,?,?n?1??????r???r????r???r????r???r其中括号和?都表示?1,?,?n?1的函数。因此。当z>0时,
2
P?2?z?C是常数。
????1?2??n2?zn-1-rdr???0r?z?C ????2 为了定出C,在上述等式的两端令r???,得到
1?1?2??n2???n?1?r???0r?zdr?C ????n2?2z2从而,
C??2??
???0rn?1?dr11在分母内的积分中令r2??,即,用r?2?2作代换,那么,这个积分等
2于?2?0??n-12n?12????1???1?1?n?1?2??2d??22??2??nd??22???
02?2?n21nnn因此,C??2??2n?12?n?????2?从而,当z>0时,
Px2?z?2????1n?12????2???n?zx0?n?1?d?
?2z ?12n?12????2????n?0n?12?2d?
??即,?2的密度函数为
nz?1??1z2e2,当z?0?n?n? fz2?x???22?????2???0,其他?称这个密度函数所定的分布为自由度为n的?2分布,记作?(n)。它的图像如下:
23
图(一)?分布密度函数图
2四、卡方分布的累积分布函数为:
Fk?x???fx2?x?dx
???? ????n21?n?2????2?0xnx?1?22edx
Fk?x????k2,x2???k2?,
其中γ(k,z)为不完全Gamma函数。其图像如下:
图(二)?分布的分布函数图
2五、 卡方分布的特征函数及其推导:
4
特征函数:ψ(t)
= f(x)dx
=dx
=
六、 论证过程中的心得体会:
首先通过对卡方的研究和证明,提高了我们对数学的兴趣。其次,通过这次的推导和搜索资料进行分析,大大提高了我们的独立思考的能力,我们当中很多同学之前都很害怕类似的证明题,这一次的合力解决难题使我们信心倍增。 当然同时,这个合作锻炼了我们团队合作的能力,分工合作解决问题,有的人负责收集资料,有点人负责推导公式,有的人负责输入文章,整理公式,等等。这让大家明白了团结的力量。做出合理的时间安排, 做任何事情,合理的时间安排非常重要,多元课程设计也是一样,事先要做好一个规 划,课程设计一共分5个板块(定义,性质,特征函数,密度函数,分布函数,心得体会)。你每 天要做完哪几个板块事先要确定好,这样做才会使自己游刃有余,保证在2周时间内内完成论文,以避免由于时间上的不妥,以致于最后无法完成论文。
另外,写论文的过程中也使我们对论文的格式有了一个了解,更规范更具体,为以后的学业报告做了一次很好的准备。论文属于科学性的文章,它有严格的书写格式规范,因此一篇好的论文一定 要有正确的格式,论文格式错误就不能得到好成绩,因此我们写论文时要端正态度,注意书写格式。
多元课程的设计更加是丰富了我们的业余生活,让大家聚在一起讨论题目,其乐融融。这样的课程设计也能使我们找到志同道合的朋友,发现生活中的点滴数学趣事,从实际出发思考题目,同时我们对计算机的知识也有了一定的加深,matlab 的使用等等。
5
t分布的有关知识 t分布的概述及其历史 在概率论和统计学中,学生t-分布(Student's t-distribution)应用在当对呈正态分布的母群体的均值进行估计。它是对两个样本均值差异进行显著性测试的学生t测定的基础。t检定改进了Z检定,不论样本数量大或小皆可应用。在样本数量大(超过120等)时,可以应用Z检定,但Z检定用在小的样本会产生很大的误差,因此样本很小的情况下得改用学生t检定。在数据有三组以上时,因为误差无法压低,此时可以用变异数分析代替学生t检定。 当母群体的标准差是未知的但却又需要估计时,我们可以运用学生t-分布。 学生t-分布可简称为t分布。其推导由威廉·戈塞于1908年首先发表,当时他还在都柏林的健力士酿酒厂工作。因为不能以他本人的名义发表,所以论文使用了学生(Student)这一笔名。之后t检验以及相关理论经由罗纳德·费雪的工作发扬光大,而正是他将此分布称为学生分布
由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为
t变换t=
x?u,统计量t 值的分布称为t分布。 sxt分布的分布函数及证明
用T(x;n)表示tn分布的分布函数,则
T(x;n)??111In/(n?x2)(,n)222x?0 1?11?1?I2/(n?x2)(,n)?x?0x2?22??x证明 根据分布函数的定义有
xT(x;n)??t(y;n)dy??????1y2?(n?1)/2?(1?)dy
11n?B(,n)22当x?0时,上式为
0T(x;n)????1y2?(n?1)/21y2?(n?1)/2?(1?)dy??(1?)dy?A1?A2
1111nn0?B(,n)?B(,n)2222x?22由于t(y;n)dy?1,故立即可得A1?1/2,为了计算A2,我们做变换t?y/(n?y)则
???dy?(n?y2)2/(2ny)?dt?
?2t?12(1?t)dt,因此
6
?32x21y1A2??(1?)?(n?1)/2dy??(1?t)1111n00?B(,n)?B(,n)2222111?Ix2/(n?x2)(,n) 2221111故T(x;n)?A1?A2??IX2/(n?x2)(,n)
2222 ?x2n?x2n?12??2t?12(1?t)dt
?321?11?1?I(,n)? x2/(n?x2)?2?22??0?x而当x?0时,我们有
11T(x;n)?1??t(y;n)dy???t(y;n)dy???t(y;n)dy
2x20x然后利用刚刚的讨论可知
T(x;n)?1111111?Ix2/(n?x2)(,n)?In/(n?x2)(,n) 2222222综上所述便得我们所要的结论。
t分布的密度函数及证明
设?,z为相互独立随机变量,?服从正态N(0,1),z服从自由度为n的?2—分布,则t=?z的密度函数为 n?(ft(x)?f?/z/n(x)?n?1)n?12?x2?(1?)2
nnn??()2称ft(x)是自由度为n的t—分布(或Student分布)的密度函数, 证:首先,易知?与z相互独立,事实上, nz?y}?P{??x,z?ny2}nF?,(x,y)?P{??x,zn?P{??x}?P{z?ny2}?P{??x}?P{?F?(x)?Fzn?y}
F?,z(y),当y?0时.n(x)?0?F?(x)?0?F?(x)?Fz(x),当y??0时.znn7
故得证?与z是相互独立的.(其实,由商的密度函数为
nf?1(x)?????f?1(x2x)f?2(x2)x2dx2.?2故fn22()x2x2nx2??21n2(x)?2???x2e2dx2,0en2?z?()n22(x)?zn?令u?x2n?x2,则上式变为nn2n?12f?n?()?(n?x2)22nn?1n2?()2?n?1n2?()?(n?x)22n?1?()n?12?x2?(1?)2.nnn??()2n?u??du02ue
证明过程用到公式
??1?x?2??1?y?(?)???xedx?2?yedy002(??0).
t分布的w特征函为:
n?1)?x^2n?12?(t)??(1?)^(?)wal(x,t)dx
?nn2?()n?2?(t分布有如下特征:
1、t分布是对称分布,且其均值为0
2.t分布是一簇曲线,其形态变化与n(确切地说与自由度ν)大小有关。自由度ν越小,t分布曲线越低平;自由度ν越大,t分布曲线越接近标准正态分布(u分布)曲线,如图1。
3、t分布是一个分布族,对于不同的样本容量都对应不同的分布,且其均值都为0。
8
4、与标准正态分布相比,t分布的中心部分较低,2个尾部较高。 5、变量t的取值范围在??到??之间
图1自由度为1、5、∞的t分布
t分布有如下性质:
x2?(n?1)/2)性质1 令g(x)?(1? nn?1x2?(n?3)/2(1?)?x 则g?(x)??nnn?1x2?(n?5)/2x2n?32g??(x)??(1?)(1??x)nnnn
故
g??(x)?0的解为
x??n/(n?2),即分布密度在x??n/(n?2)处有拐点。
性质2 limt(x;n)?n??12?e1?x22
r性质3 设X~tn,若r?n,则E(X)存在;若r中判别积分收敛的法则很容易看出。
?n,则E(Xr)不存在。此点由微积分
? 若r?n,且r为奇数,由于函数x(1?x/n)r2?(n?1)/2是x的奇函数,因此,?r?0;
9
若
?r?n且r为偶数,可以算得?r??r?nr/21?3?5?(r?1) 特别
(n?2)(n?4)?(n?r)E(X)?0,Va(rX)?n6,n?3,4,? r1?0,r2?,n?5,6,? n?2n?4性质4 tn分布由于只有n?1阶矩存在,故没有矩母函数存在。 性质5 如X1和X2独立同分布于?2n,则随机变量Y?12??(X2?X1)/X1X2~tn。
?t分布的?分位数
当X~t?n?时,P?X?t??n??=?.给出概率?和自由度n,t分布的?分位数记作t??n?.如图所示,
可从t分布的分为表中查出t??n?.与标准正态分布相类似,根据t分布密度曲线的对称性,也有
t??n??t1???n?,论述同u???u1??.如果在t分布的分为表中没有负的分位,则先查出t1???n?,然后得到t??n??t1???n?. 例如,
t0.95?4??2.132,t0.975?4??2.776,t0.995?4??4.604,t0.005?4???4.604,t0.025?4???2.776,t0.025?4???2.132另外,当n?30时,在比较简略的表中查不到t??n?,可用u?作为t??n?的近似值.
t分布的?分位数
t分布表 n 0.25 0.2 0.15 0.1 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005 1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657 127.32 318.31 636.62 2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925 14.089 23.326 31.598 3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841 7.453 10.213 12.924 4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.61 5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869 6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959 7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408 10
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041 9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781 10 0.70 0.879 1.093 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587 11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106 3.497 4.025 4.437 12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055 3.428 3.930 4.318 13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012 3.372 3.852 4.221 14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977 3.326 3.787 4.14 15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073 16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921 3.252 3.686 4.015 17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898 3.222 3.646 3.965 18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878 3.197 3.610 3.922 19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861 3.174 3.579 3.883 20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845 3.153 3.552 3.85 21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.135 3.527 3.819 22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819 3.119 3.505 3.792 23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807 3.104 3.485 3.767 24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797 3.091 3.467 3.745 25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787 3.078 3.450 3.725 26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779 3.067 3.435 3.707 27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771 3.057 3.421 3.69 28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763 3.047 3.408 3.674 29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756 3.038 3.396 3.659 30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750 3.030 3.385 3.646 40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704 2.971 3.307 3.551 60 0.679 0.848 1.045 1.296 1.671 2.000 2.390 2.660 2.915 3.232 3.46 120 0.677 0.845 1.041 1.289 1.658 1.98 2.358 2.617 2.860 3.160 3.373 ? 0.674 0.842 1.036 1.282 1.645 1.96 2.326 2.576 2.807 3.09 3.291
广义非中心t分布
定义:
12?x1?nX1?。设x??(2)?~ECn?1(?,In?1,?),其中x(2):n?1且??(*)t?(?,0,?,0)1x???(x(2)x(2))2的分布称为广义非中心t分布,记为t~Gtn(?,?)或t~Gtn(?,f)。
定理1:设t~Gtn(?,f),则t的密度是
11
2(n?)(*1)
1?(n)2其中?1?t?/(n?t)。
2121n2(n?t)21?(n?1)2??0f(y2?2?1y??2)yndy,???t???,
证:设x~ECn?1(?,In?1,f),其中??(?,0,?,0)?且h(?)是Borel函数使得E(h(t))??。
m?1m?(?)1?1122yf(y)dy?(?)?(m)I(fm)对于利用?f(?x)dx1,?,dxm?1?01221?(m)2m2i???2?h(n2x1/r)f((x1??)2?r2)rn?1drdx1 X2,?,Xn?1,则我们有E(h(t))?????01?(n)21n211m211 (*2) ?2?1n2121?(n)n212???????0h(t)f((tr/n??)2?r2)rndrdt
12因此,t的密度是
2?121n21n?(n)22??0f((t?n)rn?2t?rn22?1???2)rndr,
令y?((t?n)/n)r,我们立得(*)。 当??0时,(*1)成为我们熟悉的密度t。
推论1:设t~Gtn(?,f),Eh(t)??,则(*3)E(h(t))?122?1?0?()21n2?M(?)?nf(?2)d?,其
中(*4)M(?)??x0h(n(???cos?)/(?sin?))sinn?1?d?。
12证:做变换x1????cos?,r??sin?,则由(*2)结论得证。
11(k?2j)[k]n?((n?k))k!k?2j22k??2推论2:设Et??,则(*5)E(tk)? ?2j?12j!(k?2j)!cn?k?2j?1j?0?(n)212
1k2其中[x]表示x的整数部分,且c由cl~1?(l)22?1l2??定义。特别(注意cn?1?1)
0rl?1f(r2)dr1??12(n?)??((n?1))??2?E(t)?n?1?1???(n)cn??2??2n2??2?[?1]n?2?(*6) ?E(t)?? n?2cn?1??2??n2??var(t)?[?1]??n?2cn?1????1122?n??(?((n?1))/(?(n)c))??n?122??由(*3),(*4)和Legendre倍量公式?(2a)?
22a?1?
121?(a)?(a?),结论得证。
2分布
一、定义
如果随机变量的密度函数为
则称随机变量服从第一自由度为,第二自由度为的分布,记为
。
二、性质
13
1、设随机变量与相互独立,且,,则随机变量。
证明:因为随机变量与分别分布,所以其密度函数分别为
,
由商的密度函数公式,故得
令,得
,其中
所以,随机变量。
2、设随机变量,则,D。
解:
令,得
14
令
,得
同理可得,
D
3、设随机变量证明:因为随机变量
,则。
,所以其密度函数为
。
则的密度函数为
所以,
。
4、若随机变量,则。
证明:因为随机变量,所以其密度函数为
的密度函数为
15
所以,
。
三、非中心分布
设
,
,且与相互独立,令
,则称服从自由度为
,非
中心参数为的非中心分布,记为
随机变量的密度函数为
。
证明:
的联合分布为
作变换
则
的联合分布为
16
的边沿分布为
将改为,即为所证。
二次型的分布
17
定义:设随机向量x~Np(0,Ip),A为p阶对称阵,则称y=x?Ax=??aijxixj为随机变量x的二次型.i?1j?1二次型分布的性质:①特征函数:我们考虑标准正态向量的二次型,有y的特征函数为:r?1/2?y(t)??(1?2it?j)?1/2?????itA?j?1证明:对二次型y?x?Ax的分布,由谱分解我们有A=????,其中?为正交阵,?=diag{?1,...?r,0,...0},?1,...?r为A的非零特征值,且r?rk(A)记z???x,显然z~NP(0,Ip)?y?x?Ax?z??z?r?j?1?jzj2rj?1?y的特征函数为?y(t)=Ee^(it?注意到zj221?jzj)??2rj?1?zj2(t?j)
~x,又|?||I-2it?||??|=?rr(1?2it?j)j?1?1/2可得?y(t)??(1?2it?j)?1/2?????itA?j?1
②均值与方差及协方差:设X~Np(?,?),?为对称阵,则均值为:?(X?AX)=trA?+??A?,2方差为:Var(X?AX)=2tr(A?)+4??A?A?,协方差为:Cov(X,X??X)=2???。证明:对方差我们有Var(X??X)=E[X??X?E(X??X)]2=E[X??X?tr(A????????2
18
=E[trA(XX?????????2?E(?aij(XiXj??ij??i?j)]2i,j然后利用等式(i)E(Xi-?i)(Xj??j)?Xk ??=0(Xi??i)(Xj??j)(Xk??k)(Xl??l)??ij?kl??ik?jl??il?jk?ii?E对协方差我们有Cov(X,X?AX)=E{(X-?)?X??XX?E(X??X)]}?E{(X?????X??X??????tr(A?????E{(X?????X??????X??????X???????tr(A???}=??{?X??(?A?}?X??)=2?A?
③其他一些性质2()设1X~Np(0,Ip),A'=A,则X'AX~X(r),当且仅当rank(A)=r且A2=A(2)设X~Np(?,Ip),Ai?=Ai,qi=X?AiX,i=1,2, 其中?Ai=I,则如下三个命题是相互等价的:i?1kk,
(i)q1,q2, qk相互独立且均服从非中心的X^2分布;(ii)?rank(Ai)=p;i?1k(iii)Ai^2=Ai,i=1,2,…k,且AiAj=0,1?i?j?k。
19
二次型分布定理:以下为标准正态向量的二次型的重要定理定理1 设x和s?rk(A).证明:易知y的特征函数为?y(t)??(1?2it?j)?1/2j?1rNp(0,Ip),y?x'Ax,A为对称阵,则yxs2?A2?A又知一个自由度为s的x2分布的特征函数为(1?2it)?s/2,?yxs??(1?2it?j)?1/2?(1?2it)?s/2,2rj?1作为两个t的多项式恒等,必须各项系数相等。因此通过系数比较,得yxs2?r?s且?j?1,j?1,,r.?Ir0?2于是?=??,且A?T?T'?T?T'T?T'?A得证。?00?以下为一般正态向量的二次型重要定理定理2.设xNp(?,?),??0,A为对称阵,则x'Ax~xr2(?)?A?A?A,r?rk(A)并且?=?'A?.证明:提示:一个非中心xr2(?)分布的变量y的特征函数为?y(t)?(1?2it)定理3.设x?A1A2=0.?r/2eit?/(1?2it).二次型的独立性Np(0,Ip),A1A2为对称幂等阵,则x'A1x和x'A2x相互独立
证明:先证充分性x'Aix?(Aix)'Aix,
20
?由A1A2?0,推得A1x与A2x独立.?x?A1x与x?A2x相互独立再证必要性,由于A1,A2对称幂等性,由定理1可知x?A1x和x?A2x均服从x2分布,记x?Aix~x2ri,i=1,2,其中ri?rk(Ai).由于两者独立,由x^2分布的可加性.有(x?A1+A2)x?x?A1x?x?A2x~(x2)r1?r22再由定理1可知A1+A2幂等,即(A1+A2)=A1+A2.从而推得A1A2+A2A1=0.而又由用A1左和右分别乘以上式及A1的幂等性.有A1A2+A2A1=0和A1A2A1+A2A1=0.又推得A1A2A1=0.?A1A2=0.推论1:设x~NP(?,?),??0,二次型x?A1x和x?A2x服从x2分布,则两者独立的充要条件A1?A2=0.证明:充分性显然:A1?A2=0.则A1x与A2x相互独立.?x?A1x与x?A2x相互独立.再证必要性:由定理2,假设条件意味着A1=A1?A1,A2=A2?A2.仿照定理3的证明,由独立的x2可加性,有(x?A1+A2)x服从(x2)r1?r2(?1??2),(其中ri?rk(Ai),?i??Ai???i=1,2)又A1+A2=(A1+A2)(A1+A2).?可得A1?A2?0.
21
二次型和线性型的独立性定理4、设x~NP(?,?),?>0,A为P阶对称阵,P为k?p阶阵,rk(P)?k,二次型x?Ax服从x2分布,则x?Ax与线性型Px独立?P?A?0.?证明:必要性:考虑矩阵P?1/2的奇异值分解,P?1/2=U?V.其中?为正数元对角阵,U?U=I,V?V=I,令z=??1/2x,z~Np(??1/2?,IP),并有Vz?~Nk(U???1/2?,Ik)?z?UU?z~x2k(?0),?0?????1/2UU???1/2?.假设x?Ax与Px独立.则有z??1/2A?1/2z与P?1/2z或者z??1/2A?1/2z与U?V?z独立.由于U有左逆和?可逆.推得z??1/2A?1/2z与z?VV?z独立.再由定理3,推得VV??1/2A?1/2=0.用V?左乘上式得V??1/2A?0,又用U?左乘它即得U?V??1/2A?0?P?A?0.充分性:当P?A?0时,由上述奇异值分解有V??1/2A?0.?V?z与A?1/2z独立?U?V?z与z??1/2A?A?1/2z独立.即x?Ax与线性型Px独立,得证.
22
一. Wishart分布
设x1,,xn相互独立同标准正态N(0,1)分布,令X?(x1,,xn)',则
Y?XX??xi2~?2(n) ①
'i?1n其密度函数为:
??n?? ?2n/2????yn?2???而在x1,?1/?21?y?ex?p??y,??2? 0 , ②
,xn相互独立同正态N(0,?2)分布时,Y~?2?2?n?,其密度函数为:
?n/2?n???y??nn/2?12??yexp??2?,y?0, ③ ????2????2????1
下面将上述结果推广至多元正态分布的情况。
二. Wishart分布的定义
假设Y?1?,Y?2?,...,Y?m?相互独立,
Y???~NPu???,?
??其中:??0,Y?Y,Y,...,Y??1??2??m??p?m,U?YY'??Y??Y??,则称随机阵U服
aa'm??112m从自由度为m,非中心参数为M?u??,u??,...,u??p?m=E?Y?的非中心wishart
??分布,记为u~Wp?m,?;M?,特别地,当M??0,0,....,0?时,则称之为中心wishart分布,记为:u~Wp?m,??,其概率密度为:
?1Wp?1?nppn?n???? f?W,????22?n?p?1??2????2????0???0,其它N?P?12?1?exp??t???1W?,W?0?2? ④
其中W??aij?p?p为对称阵,是随机矩阵U的观测值矩阵。
23
三.Wishart分布的特征函数
定理:如果S~Wp?m,??,(??0已蕴含在W分布的定义中),则
?s?T??IP?2i?T
?m2,其中T??tij?p?p为实变元对称阵。
证明:因为S~Wp?m,??,所以S可表示为f??Y???Y???',其中Y?1?,Y?2?,...,Y?m???1?m独立同分布与Np?0,??,??0。有随机矩阵特征函数的定义可知
?s?T??E?eit??T'S??,且T'?T,因此有:
mmm?m??????'??'???????'??????tr?T'S??trTS?trST?tr??YY?T?tr?YYT?tr?YTY??Y??TY?????1??1???1??i?Y???'TY????m?'?iY??TY????1????Ee?[LE?eiY'TY?]m,其中Y~NP?0,??,从而?s?T??Ee????1??m??由对角定理,对于对称阵T及正定阵??1,必存在奇异阵B使得:
B'??1B?IP,
?a1??1'?1?1'',即??BB,??BBBTB????0之Y?BX, 则:
?????1X?BY,反,做变换?a??an?0??
?1?1?1X~Np?0,B?(B)? ⑤
由于??BB',所以X~NP?0,??。记X??X1,X2,则有X1,2,XP?N1?0,1?,故有XK~X12,K?1,,P.
p,XP?,
'1?2??1pi??kXk2'''?iYTYiXBTBXi?1????1?2i?k??I?2i?2 ??E?e??E?e从而E?ep??????k?1??而Ip?2i??B'??1B?2iB'TB?B'??1?2iTB=???1?2iT?IP?2iT?
24
因此有?s?T??IP?2iT??m2。
?m2反之,若是对称阵S的特征函数?s?T??IP?2iT?
,则S~WP?m,??。
四.Wishart分布的性质
性质1:
设总体X?NP?u,??,则样本离差阵S服从自由度为n-1的wishart分布,即:
__????S???Xi?X??Xi?X??WP?n?1,?? ⑥
???i?1?
__1????证明:S???Xi?X??Xi?X??X'HX,且H?I?II',由H2?H和
n???i?1?n'n'rk(H)?n?1,
由定理:X为Np?0,??的n?p阶数据阵,A为n?n对称阵,且A2?A,rk?A??r,则X'AX~WP?r,??,则X'HX~?n?1,??。
性质2:
(可加性)设W1~WP?n1,??,W2~WP?n2,??,且W1,W2相互独立,则
W1+W2~WP?n1+n2,??。
证:(用特征函数)由W1?WP?n1,??,W2?WP?n2,??,可知其特征函数分别为
m12m22?1?T??Ip?2i?T?,?2?T??Ip?2i?T?,又由W1,W2相互独立,可推之W1+W2?m2+m12的特征函数为??T???1?T???2?T??Ip?2i?T,由定理1之逆可知,
W1+W2~WP?n+,??成立。 1n2
性质3:
设W~WP?n,??,对任意m?p阶常数矩阵C,有CWC'~Wm?n,C?C'?,特别的有,aW~WP?n,a??(a>0,为常数)。
25
证明:由W~WP?n,??,可知W??X???X???,其中X?1?,??1N',X?N?相互独立,且
X???~Npu???,?,?>0,??1,??,N,M?u?1?,????,u?N?,
???'?故CWC??CX'??1N??????CX?,而CX???'~NPCu,C?C,且CX?1?,,CX?N?也相
??'互独立,则CWC'~Wm?n,C?C'?。
同理得:aW~WP?n,a??(a>0,为常数)。
?关于p阶wishart分布密度函数有以下说明:
(1)、W是p阶对称阵,(3)式是W的p(p?1)/2个变量,
??11,,?1p,?22,,?2p,,?pp?的密度函数,而积分区域是使得W>0的这些变量
所构成的区域。 (2)、为了使得
p阶wishart分布有密度函数,除了??0,为什么还要求
n?p?这是因为p阶矩阵W以概率1为正定矩阵的充要条件是n?p。
证:由于W?XX',X是n?p阶矩阵,所以n?p时,p阶矩阵W不可能是正定矩阵。此外,在n?p时,W?XX??xx??xixi',所以欲证W以概率1为正
''iii?1i?1np定矩阵的充要条件是n?p,仅需要证明在n?p时,p(W?0)?1。 在n?p时,由于W?XX',所以 W不是正定矩阵?X?0。 令xi?(xi1,,xip)',i?1,,p。显然G??xij,i,j?1,,p:X?0?是p2维欧式空间
中一个没有内点的集合。由此可见,p?x?0??0。从而有p?w?0??1.故W以概率1为正定矩阵的充要条件是n?p得到证明。
26
五.非中心wishart分布的定义
t布是非中心?2分布的推广。若x1,非中心wishar分
n,xn相互独立,
xi~N(?i,1),i?1,n,则称,Y??xi2服从非中心?2分布,其自由度为n。它的分
i?1布除了与n有关外,还与a???i2有关,a称为非中心参数。非中心?2分布记
i?1n为?2?n,a?。显然,在xi~N(?i,?n2n2)时,?(xi/?)2服从非中心?2(n,a)分布,其
i?1n中,a??(xi/?)。这时Y??xi2??2?2(n,a)。
i?1i?1下面将非中心?2分布推广到非中心wishart分布。若x1,,xn相互独立,
xi~Np(?i,?),??0,i?1,,n,则称W??xixi'服从非中心wishart分布,显然W
i?1?1/2n的分布与p,n和?有关。下面证明其分布与H??令yi???1/2?xi??i?~Np(0,Ip),i?1,(??i?i')??1/2有关。
i?1n,n,则因xi???1/2yi??i,i?1,,n,所以
W=?xx??'iii?1n?1/2nn?n??1/2''?1/2?1/2'yy?y?????y?H???????iiiiii???,
i?1i?1?i?1?其中:
n?yyii?1'iin'i~Wp?n,Ip? ⑦
?y????~?1/2i?1N?p?0,H?I? ⑧
pp
???i?1n?1/2'?i?yi~N?pH?p0,I?? ⑨ P由此看来,W的分布仅与p,n,?和H有关。
27
三. Wishart分布
设x1,,xn相互独立同标准正态N(0,1)分布,令X?(x1,,xn)',则
Y?XX??xi2~?2(n) ①
'i?1n其密度函数为:
??n?? ?2n/2????yn?2???而在x1,?1/?21?y?ex?p??y,??2? 0 , ②
,xn相互独立同正态N(0,?2)分布时,Y~?2?2?n?,其密度函数为:
?n/2?n???y??nn/2?12??yexp??2?,y?0, ③ ?????2???2????1
下面将上述结果推广至多元正态分布的情况。
四. Wishart分布的定义
假设Y?1?,Y?2?,...,Y?m?相互独立,
Y???~NPu???,?
??其中:??0,Y?Y,Y,...,Y??1??2??m??p?m,U?YY'??Y??Y??,则称随机阵U服
aa'm??112m从自由度为m,非中心参数为M?u??,u??,...,u??p?m=E?Y?的非中心wishart
??分布,记为u~Wp?m,?;M?,特别地,当M??0,0,....,0?时,则称之为中心wishart分布,记为:u~Wp?m,??,其概率密度为:
?1Wp?1?nppnn????? f?W,????22?n?p?1??2????2????0???0,其它N?P?12?1?exp??t???1W?,W?0?2? ④
其中W??aij?p?p为对称阵,是随机矩阵U的观测值矩阵。
三.Wishart分布的特征函数
28
定理:如果S~Wp?m,??,(??0已蕴含在W分布的定义中),则
?s?T??IP?2i?T
?m2,其中T??tij?p?p为实变元对称阵。
证明:因为S~Wp?m,??,所以S可表示为f??Y???Y???',其中Y?1?,Y?2?,...,Y?m???1?m独立同分布与Np?0,??,??0。有随机矩阵特征函数的定义可知
?s?T??E?eit??T'S??,且T'?T,因此有:
mmm?m??????'??'???????'??????tr?T'S??trTS?trST?tr??YY?T?tr?YYT?tr?YTY??Y??TY?????1??1???1??i?Y???'TY????m?'????EeiY??TY???[LE?eiY'TY?]m,其中Y~N?0,??,从而?s?T??E?e??1P????1??m??由对角定理,对于对称阵T及正定阵??1,必存在奇异阵B使得:
B'??1B?IP,
?a1??1'?1即??BB?1,??BB',B'TB????0之Y?BX, 则:
?????1??a,做变换X?BY,反?an?0??
?1?1?1X~Np?0,B?(B)? ⑤
由于??BB',所以X~NP?0,??。记X??X1,X2,则有X1,2,XP?N1?0,1?,故有XK~X12,K?1,,P.
p,XP?,
'1?2??1pi??kXk2'''?iYTYiXBTBXi?1????1?2i?k??I?2i?2 ??E?e??E?e从而E?ep??????k?1??而Ip?2i??B'??1B?2iB'TB?B'??1?2iTB=???1?2iT?IP?2iT? 因此有?s?T??IP?2iT?
?m2。
29
反之,若是对称阵S的特征函数?s?T??IP?2iT?
?m2,则S~WP?m,??。
四.Wishart分布的性质
性质1:
设总体X?NP?u,??,则样本离差阵S服从自由度为n-1的wishart分布,即:
__????S???Xi?X??Xi?X??WP?n?1,?? ⑥
???i?1?
__1????证明:S???Xi?X??Xi?X??X'HX,且H?I?II',由H2?H和
n???i?1?n'n'rk(H)?n?1,
由定理:X为Np?0,??的n?p阶数据阵,A为n?n对称阵,且A2?A,rk?A??r,则X'AX~WP?r,??,则X'HX~?n?1,??。
性质2:
(可加性)设W1~WP?n1,??,W2~WP?n2,??,且W1,W2相互独立,则
W1+W2~WP?n1+n2,??。
证:(用特征函数)由W1?WP?n1,??,W2?WP?n2,??,可知其特征函数分别为
m12m22?1?T??Ip?2i?T?,?2?T??Ip?2i?T?,又由W1,W2相互独立,可推之W1+W2?m2+m12的特征函数为??T???1?T???2?T??Ip?2i?T,由定理1之逆可知,
W1+W2~WP?n+,??成立。 1n2
性质3:
设W~WP?n,??,对任意m?p阶常数矩阵C,有CWC'~Wm?n,C?C'?,特别的有,aW~WP?n,a??(a>0,为常数)。
证明:由W~WP?n,??,可知W??X??1N???X???',其中X?1?,,X?N?相互独立,且
30
X???~Npu???,?,?>0,??1,??,N,M?u?1?,????,u?N?,
???'?故CWC??CX'??1N??????CX?,而CX???'~NPCu,C?C,且CX?1?,,CX?N?也相
??'互独立,则CWC'~Wm?n,C?C'?。
同理得:aW~WP?n,a??(a>0,为常数)。
?关于p阶wishart分布密度函数有以下说明:
(1)、W是p阶对称阵,(3)式是W的p(p?1)/2个变量,
??11,,?1p,?22,,?2p,,?pp?的密度函数,而积分区域是使得W>0的这些变量
所构成的区域。 (2)、为了使得
p阶wishart分布有密度函数,除了??0,为什么还要求
n?p?这是因为p阶矩阵W以概率1为正定矩阵的充要条件是n?p。
证:由于W?XX',X是n?p阶矩阵,所以n?p时,p阶矩阵W不可能是正定矩阵。此外,在n?p时,W?XX??xx??xixi',所以欲证W以概率1为正
''iii?1i?1np定矩阵的充要条件是n?p,仅需要证明在n?p时,p(W?0)?1。 在n?p时,由于W?XX',所以 W不是正定矩阵?X?0。 令xi?(xi1,,xip)',i?1,,p。显然G??xij,i,j?1,,p:X?0?是p2维欧式空间
中一个没有内点的集合。由此可见,p?x?0??0。从而有p?w?0??1.故W以概率1为正定矩阵的充要条件是n?p得到证明。
五.非中心wishart分布的定义
31
t布是非中心?2分布的推广。若x1,非中心wishar分
n,xn相互独立,
xi~N(?i,1),i?1,n,则称,Y??xi2服从非中心?2分布,其自由度为n。它的分
i?1布除了与n有关外,还与a???i2有关,a称为非中心参数。非中心?2分布记
i?1n为?2?n,a?。显然,在xi~N(?i,?n2n2)时,?(xi/?)2服从非中心?2(n,a)分布,其
i?1n中,a??(xi/?)。这时Y??xi2??2?2(n,a)。
i?1i?1下面将非中心?2分布推广到非中心wishart分布。若x1,,xn相互独立,
xi~Np(?i,?),??0,i?1,,n,则称W??xixi'服从非中心wishart分布,显然W
i?1?1/2n的分布与p,n和?有关。下面证明其分布与H??令yi???1/2?xi??i?~Np(0,Ip),i?1,(??i?i')??1/2有关。
i?1n,n,则因xi???1/2yi??i,i?1,,n,所以
W=?xx??'iii?1n?1/2nn?n??1/2''?1/2?1/2'yy?y?????y?H?????ii??ii?ii??,
i?1i?1?i?1?其中:
n?yyii?1'iin'i~Wp?n,Ip? ⑦
?y????~?1/2i?1N?p?0,H?I? ⑧
pp
???i?1n?1/2'?i?yi~N?pH?p0,I?? ⑨ P由此看来,W的分布仅与p,n,?和H有关。
HotellingT2分布
32
回顾t分布的定义。假设变量X与Y相互独立,X~N(0,1),Y~?2(n),则
t?X~t(n) (1) Y/n称变量t服从自由度为n的t分布。显然,若X~N(0,1),Y~?2(n),则t仍然服从自由度为n的t分布。事实上,所谓的将t分布推广到多元正态分布的场合并不是直接将t进行推广,而是将t2进行推广。t2服从F分布
X2t?n~F(1,n)。
Y2下面将t2推广到多元正态分布的场合。 1.HotellingT2分布的定义
定义:设X~NP?0,??,随机阵W~WP?n,?????0,n?P?,且X与W相互独立,则称统计量T2?nX?W?1X服从自由度为n的(中心)HotellingT2分布,记为
T2~T2?P,n?。
由于
T2?n(??1/2X)?(??1/2W??1/2)?1(??1/2X)
??1/2X~Np(0,Ip),??1/2W??1/2~Wp(n,Ip) 所以T2的分布与?无关。
一般地,若X~NP??,??,则称统计量T2?nX?W?1X的分布为非中心HotellingT2分布,记为T2~T2?P,n,??。
2.关于(中心)HotellingT2分布的一些性质: 性质1:设X(1),,X(n)是总体Np??,??,??0,n?p的随机样本,则统计量
T2?n(n?1)(X??)?S?1(X??)~T2?p,n?1?。
?1?证明:因为X~NP??,??,
?n?33
所以 n?X???~NP?0,??。
?而 S???Xi?X??Xi?X?~WP?n?1,??,且X和S相互独立,从而
i?1n?T2?n?n?1??X???S?1?X???
??1??n?1?n?X???Sn?X???~T2?P,n?1?????性质2:T2与F分布的关系:设T2~T2(p,n),则
n?p?12T~F(p,n?p?1)。 np在一元统计中(设X~N(0,1),??~2n(且),相互独立)若t?X?n~t(n),则
X2p?1时,一维总体X~N(0,?2), t?~F(1,n。当)?/n2222W??X(?)X(??)??X(2?)~W1(n,?)即??(n),所以(因p?1,dnn????1??1n?p?1n?) n?pnn2nX2(X/?)2?1T?nX?WX??~F(1,n),这是性质2的特例,即当p?1时, 2nW(W/?n)T2~F(1,n)。 一般地,
n?p?1T2dn?p?1n?p?1X???1Xn?p?1??1?1??X?WX?X??X/?? ?1pnppX?WXp? ??/p?/(n?p?1)?12~F(p,n?p?1)
X???1X~?2(n?p?1), 其中,??X??X~?(p,?)(??0),还可以证明???1X?WX且?与?相互独立。 特别,设X1,,XniidNp??,??,??0,n?p,则
T2?n(n?1)X?S?1X~T2p,n?1,n?
??34
n?pT2n?p??nX?S?1X?~F?p,n?p,??,其中??n????1?。 ?pn?1p
补充书本以外的一些性质如下:
由于X与W相互独立,所以在X给定的条件下,W条件分布仍为W~WP?n,??,
X???1X则Y?的条件分布为?2(n?p?1)。 ?1X?WX由于这个条件分布与给定的X没有关系,所以Y与X相互独立,并且Y的(无条件)分布
仍为?2(n?p?1)。由于X~NP?0?,?,根据多元正态分布的性质知,
X???1X~?2(p)。 因为
X???1X X??X?X???1X/(X?W?1X)??1所以有
性质(1)
X?WX??1d?2(p)?2(n?p?1), (2)
其中,分子与分母这两个?2分布相互独立。
性质(1)说明X?W?1X服从Z(p/2,(n?p?1)/2)分布,从而(1)式可知,
HotellingT2(P,n)分布可转化为Z分布
d12?2(p)pn?p?1 T(P,n)?2~Z(,). (3)
n?(n?p?1)22由(1),有
dn?p?12n?p?1?2(p)/p?1 T?X?WX?2npp?(n?p?1)/(n?p?1)这说明HotellingT2(P,n)分布可转化为F分布。
35
性质(2)
dn?p?12?2(p)/p T(P,n)?2~F(p,n?p?1) (4)
np?(n?p?1)/(n?p?1)显然,p?1时,(4)就化为(1)式。
由性质1导出性质2,把HotellingT2的分布转化为F分布。性质(1)在把
HotellingT2的分布转化为F分布的过程中起着关键作用,所以除了记住(4)式外,还有必要记住(2),(3)式。
3.关于非中心HotellingT2分布的定义与性质
严格的说,在X与W相互独立,X~NP?0,??,W~WP?n,??时,
T2?nX?W?1X的分布是中心的HotellingT2分布。如果X~NP?0,??,则称T2的
分布是非中心HotellingT2分布。 由于
T2?n(??1/2X)?(??1/2W??1/2)?1(??1/2X)
??1/2X~Np(0,Ip),??1/2W??1/2~Wp(n,Ip)
W?1X的分布与????1/2?无关。所以T2?nX?而在??0时,非中心HotellingT2分
布就是中心的HotellingT2分布T2~T2?P,n?。
与(2)式~(4)式相类似,有
(1) 在X与W相互独立,X~NP?0,??,W~WP?n,??时,
X?WX??1d?2(p,a)?(n?p?1)2,a???(5) ??????1?,
其中,分子与分母这两个?2分布相互独立,分子的?2(p,a)是自由度为p的非中心?2分布,其非中心参数为a,由(5)式可以看出非中心T2?nX?W?1X的分布除了与p有关外,还仅与a?????????1?有关。为此,人们将非中心HotellingT2分布记为T2~T2?P,n,a?,在a?0时,T2?P,n,0?分布,就是中心的HotellingT2分
36
布。
(2) 非中心HotellingT2分布与非中心Z分布
d12?2(p,a)pn?p?1T(P,n,a)?2~Z(,,a) (6) n?(n?p?1)22 (3)非中心HotellingT2分布与非中心F分布
dn?p?12?2(p,a)/pT(P,n,a)?2~F(p,n?p?1,a) (7) np?(n?p?1)/(n?p?1)(5)式与(7)式的证明与(2)式与(4)式的证明类似。
下面讨论如何导出非中心HotellingT2分布的密度函数。由(7)式知,由非中心
F分布的密度函数可以得到非中心HotellingT2分布的密度函数。同样地,(6)
式说明由非中心Z分布的密度函数也可以得到非中心HotellingT2分布的密度函数。考虑到非中心Z分布的密度函数容易记住,由它得到非中心HotellingT2分布的密度函数的计算过程比非中心F分布的计算过程更为简单,所以下面首先介绍一下非中心Z分布的密度函数,然后导出非中心HotellingT2分布的密度函数。
根据非中心?2分布的密度函数,引入服从泊松分布的变量?后,非中心?2分
布变量y
可以理解成,在给定?后y的条件分布为中心?2分布。因而由(6)式知,若令
z~Z(p/2,(n?p?1)/2,a),则在引入服从泊松分布P(a/2)的变量?后,变量z的
分布可以理解为,在给定?后z的条件分布为中心的Z((p?2?)/2,(n?p?1)/2)分布,所以非中心Z(p/2,(n?p?1)/2,a)分布的密度函数为
(a/2)k?a/2p?2kn?p?1p(z;a)??eZ(z|,) k!22k?0?(a/2)k?a/2?((n?2k?1)/2)z(p?2k)/2?1 ?? e(n?2k?1)/2k!?((p?2k)/2)?((n?p?1)/2)(1?z)k?0?从而根据(6)式,可由非中心Z(p/2,(n?p?1)/2,a)分布密度函数得到非中心
37
T2?P,n,a?分布函数为
1?(a/2)k?a/2?((n?2k?1)/2)(T2/n)z(p?2k)/2?1(8) p(T;a)??e2(n?2k?1)/2nk?0k!?((p?2k)/2)?((n?p?1)/2)(1?T/n)2在(8)式中取a?0,即得到中心T2?P,n?分布函数为
?((n?1)/2)(T2/n)zp/2?1 (9) p(T)??(p/2)?((n?p?1)/2)(1?T2/n)(n?1)/22此外,中心T2?P,n?分布的密度函数也可以有中心Z(p/2,(n?p?1)/2)分布密度函数导出。知道中心Z(?,?)分布的密度函数为
?((???)/2)z?/2?1 p(z)?(???)/2?(?/2)?(?/2)(1?z)从而根据(3)式,就可以得到中心T2?P,n?分布函数,即(9)式。
4.一元统计分布与多元统计分布的关系示意图
N(?,?2)分布 N(0,1)分布 Wishart分布 (多元) HotellingT2分布 ?2(n)分布 T分布 Wilks分布(多元) F分布
38
回归方程的显著性检验
---------F检验
一、 一元回归方程的显著性检验(F检验)
当我们得到一个实际问题的经验回归方程y??0??1x,还不能用它作分析和预测,因为y??0??1x是否真正描述了变量y与x之间的统计规律,还需要运用统计方法对回归方程进行检验。在对回归方程进行检验时,通常需要进行正态性假设?iN(0,?2),以下的内容若无特别声明,都是在此正态性
假设下进行的。下面我们重点介绍F检验法。 (1) 分解式的引入
F检验是根据平方和分解式,直接从回归效果检验回归方程的显著性。平方分解式是
?(y?ii?1nn2 (1) y)??(yi?y)??(iy?iy )22i?1i?1nn其中,.?(yi?y)称为总平方和,简记为SST或S总或Lyy。?(yi?y)2称
2i?1i?1_n为回归平方和,简记为SSR或S回,反应了x对y的线性影响,称为回归平方或回归贡献。?(yi?yi)2称为残差平方和,简记为SSE或S残,其本质
i?1n是估计误差的平方和,这部分反应了这组实测值yi扣除了x对y的线性影响后剩下的变异。因而平方和分解式可以
SST?SSR?SSE (2)
(2) 分解式的证明
下面对上述分解式给出证明
?(y?y)ii?1ni?1nn2??(yi?yi?yi?y)2??(yi?yi)??(yi?y)?2?(yi?yi)(yi?y)22i?1i?1i?1nn
下面只需证明?(yi?yi)(yi?y)?0即可
i?1n39
又因为,
?(y?y)(y?y)iiii?1n ??ei(yi?y)i?1nn
n??ei(?0??1xi)??eiyi?1ni?1其中?ei=0,?ei(?0??1xi)=0
i?1ni?1n所以?(yi?y)??(yi?y)??(yi?yi)2分解式可证。
22i?1i?1i?1nn(3)F检验
根据方差分析的原理,判断回归贡献是否有意义可以用回归方差分析进行检验。SST中,能够由自变量解释的部分为SSR,不能由自变量解释的部分为SSE。这样,回归平方和SSR越大,回归的效果越好。又总体变异的自由度为n?1,自变量只有一个,所以回归自由度为1,误差自由度为n?2,构造F统计量如下,
F?SSR/1 (2)
SSE/(n?2)在正态假设下,当原假设H0:?1?0成立时,F服从自由度为(1,n?2)的F分布。当F值大于临界值F?(1,n?2)时,拒绝H0,说明回归方程显著,x与y有显著的线性关系。也可以根据P值做检验,具体检验过程可以放在方差分析表中进行,如表1所示。
表1 一元线性回归方差分析表
方差来源 自由度 平方和 均方 F值 P值 回归 1 SSR SSR/1 SSR/1P(F?F值) 残差 n-2 SSE SSE/(n-2) SSE/(n?2)总和 n-1 SST =P值 (F统计量的具体证明在多元线性回归模型中给出。)
二、 多元回归方程的显著性检验(F检验) 设随机变量y与一般变量x1,x2,,xp的线性回归模型为
40
y??0??1x1???pxp??其中,?0,?1,,?p是p?1个未知参数,?0称为回归
常数,?1,,?p称为回归系数。y称为因变量,而x1,x2,,xp是p个可以精确
?E(?)?0测量并可控制的一般变量,称为自变量。?是随机误差,一般假定? 2var(?)???称E(y)??0??1x1???pxp为理论回归方程。
,xip;yi)(i?1,2,,n),则
对一个实际问题,如果我们获得n组观测数据(xi1,xi2,?y1??0??1x11???y2??0??1x21?线性回归模型可表示为???y????x?01n1?ny?X???
??px1p??1??px2p??2??pxnp??n写成矩阵形式为
?1x11?y1??1x?y?212其中y???,x??????????yn??1xn1x1p???0???1???????x2p?1?,????,???2? ??????????xnp??????n???p?对多元线性回归方程的显著性检验就是要看自变量x1,x2,变量y是否有明显的影响。为此提出原假设
,xp从整体上对随机
H0:?1=?2==?p=0
如果H0被接受,则表示随机变量y与x1,x2,,xp之间的关系由线性回归模型表
示不合适。类似一元线性回归检验,为了建立对H0进行检验的F统计量,仍然利用总离差平方和的分解式,即
?(y?y)??(y?y)??(y?y)22iiiii?0i?0i?0nnn2
简写成 SST?SSR?SSE
此分解式的证明只需利用
41
??ei?0??ex?0?ii1 ????eixip?0?即残差的平均值为0,残差对每个自变量的加权平均为0。用矩阵表示为X'e?0 具体参照一元线性回归的证明。
若
n?~N?0, ?2I?2,
??Y?Y2则
??Y1?Y2总离差
SST??(yi?y)2?Y?1Yi?1。若再有条件?i?0,
i?1,2,,p满足。则SSR,SSE独立,它们与?2的商分别服从?2(p)和
?2(n?p?1)。从而
证明:
因为
SSR(p)~F(p,n?p?1)。
SSE(n?p?1)???I?H?Y??I?H??X???? =X??X?X?X??1X?X???I?H????I?H??,
所以X??I?H????X??X?X?X?X?X????0,而X第一列全是1,所以
?1??0 1??另一方面,容易看出
??????Y?H??I?H???0 Y因为
Y?1Y2??Y??Y1?2Y??Y1??? ?Y?Y22??? =Y?Y所以
Y?1Y22??Y1?2Y?????2Y1??? ?Y22??Y?Y2??Y1 ?Y
42
其余部分证明见Seber(1976)。
附?2分布、F分布的定义 定理2.4.4(?2分布) 若 n相互独立的随机变量?1,数为
,?n ,均服从正态N(0,1),则?=??k2的密度函
2k?1n1?n/2?1?x/2xe,当x?0?n/2 f?2(x)??2?(n/2)?0,其他?称为自由度为n的?2密度函数。
定理2.4.6(F分布)
2?m设?,?为独立的随机变量,分别服从具有自由度m及n的?分布。令?=2,
?n2m2n2?=
2?nn,则?=?/?的密度函数为
?0,当x?0;?f?(x)???((m?n)/2)m/2n/2xm/2?1
??(m/2)?(n/2)mn(mx?n)(m?n)/2,当x?0;?称f?(x)为自由度为m及n的F分布的密度函数。
Wilks分布的定义及性质
本文包括Wilks分布的定义、密度函数、分布函数的积分表达式和渐进展开式、特征函数的积分形式以及相关性质及证明。
回顾F分布的定义,假设变量X和Y相互独立,则X~X2(n),Y~X2(m),则
F?
X/n~F(n,m), (1) Y/m43
称变量F服从分子自由度为n,分母自由度为m的F分布,简称F服从自由度为
n和m的F分布.显然,若X~?2?X2(n),Y~?2?X2(m),则F仍服从分子自由度
为n,分母自由度为m的F分布.F分布和?分布可以互相转化.令
nXmB?? X?Y1?F?nmF?, (2)
则B~?(n/2,m/2).事实上,所谓将F分布推广到多元正态分布的场合并不是直接将他进行推广,而是将?分布进行推广.
一、Wilks分布的定义:
假设W1与W2相互独立,W1~Wp(n,?),W2~Wp(m,?),其中????n?p.记
?W1? ??, (3)
?W1?W2?称?的分布为Wilks分布.
显然,0???1.除了???,为什么还要求n?p?这是为了使得?的分子和分母为正的概率都等于1.而m和p之间,可能m?p,也可能m?p.
由于
???1/2W1??1/2? ?? (4)
???1/2W1??1/2???1/2W2??1/2?,??1/2W1??1/2~Wp(n,Ip),??1/2W2??1/2~Wp(m,Ip),
所以?的分布与?无关.通常将?的分布记为?p,n,m.
二、Wilks分布的性质:
性质1:
d?p,n,m?B1B2?Bp, (5)
其中,B1,B2,?Bp相互独立,Bi~?((n?i?1)/2,m/2),i?1,2?,p.
以下是对性质1的说明,?p,n,m 和相互独立的p个参数分别为(n/2,m/2),
44
((n?1)/2,m/2),?((n?p?1)/2,m/2)的?分布变量的乘积同分布.
采用下面的方法证明两个变量同分布.显然,若变量X与Y同分布,则X与YhhE(X)?E(Y),h?0,1,2???.反之,若X与Y的各阶矩都相等,的各阶矩都相等:
X?Y是否一定成立?X?Y是不一定成立的.存在这样的变量X和Y,它们的各阶矩都相等,但他们有不同的分布.但是在一定的条件下,若X与Y的各阶矩都相等,则X与Y有相同的分布.例如,设a0?1,a1,a2?是某个变量X的各阶矩,它们都有限,如果对某个r?0,级数
ddannr?n! (6)
n?0绝对收敛,则X是唯一以为n(n?0,1,2,?)阶矩的变量.
显然,若变量X有界,则(6)式的级数必绝对收敛,故X就被它的各阶矩唯一确定。已知性质1中的?p,n,m和B1B2?Bp都是有界的,即满足:
?0??p,n,m?1,0?B1B2?Bp?1,所以欲证性质1,仅需验证?p,n,m和B1B2?Bp的各阶矩都相等.
?(a,b)分布的密度函数为
?(a?b)a?1x(1?x)b?1,0?x?1 ?(a)?(b), (7)
所以?(a,b)分布的h阶矩为
?10xh?(a?b)a?1?(a?b)?(a?h)x(1?x)b?1dx??(a)?(b)?(a)?(a?b?h). (8)
由此得到B1B2?Bp的h阶矩
E(B1B2???Bp)h??E(Bi)hi?1p
??i?1p?(n?i?1?m/2)?(n?i?1/2?h)?(n?i?1/2)?(n?i?1?m/2?h) (9)
在m?p时,可以由(W1,W2)的联合密度求得?p,n,m的h阶矩.而在m?p时,
45
不存在W2的密度函数,将根据Wishart分布的定义,计算?p,n,m的h阶矩.下面使用的求?p,n,m的h阶矩的方法,无论m?p还是m?p,都是适用的.
假设W,x1,x2?xn相互独立,W~Wp(n,?),x1,x2,?xm同为Np(0,?)分布,其中??0,n?p,则?xixi'~Wp(m,?),
i?1m??
(10)
WW??xixi'i?1m~?p,n,m
为简化计算,不妨假设??Ip.将分一下3个步骤计算?p,n,m的矩: (1)令X'?(x1,x2?xn).首先由(W,X')的联合密度求得(U1,U2)的联合密度,其中,
'??U1?W?XX,??1/2'U?UX.??21
引入变量(U1,U2)的原因就在于
??
WW?X'X?U1?X'XU1'?Ip?U2U2. (11)
(2)然后由(U1,U2)的联合密度,导出U2的密度函数.
'(3)最后由U2的密度函数计算??|Ip?U2U2|的h阶矩.
具体说明如下:
(1)(W,X')的联合密度为
W(n?p?1)/2xi'xi1exp{?tr(W)}mexp{?}22?2np/2?p(n/2)(2?)p/2i?1
46
W?(n?p?1)/211exp{?tr(W)}exp{?tr(X'X)}22,W?0np/2mp/22?p(n/2)(2?). (12)
为了由(W,X')的联合密度得到(U1,U2)的联合密度,关键在于计算变换
(W,X')?(U1,U2)的雅克比行列式.由于变换(U1,U2)?(W,X')是
???U'1?W?XX,??U2?U?1/2'1X,
这个变换的雅克比行列式为
J((U'?(U1)?(U2)?(U2)1,U2)?(W,X))??(W)??(X')??(X')这相当于引入中间变量(U1,X'),使得
J((U1,U2)?(W,X'))
?J((U1,U2)?(U1,X'))?J((U1,X')?(W,X'))
?(U?1/2m?m/2线性变换的雅克比行列式
2)/?(X')?U1?U1,所以 J((U1,U2)?(W,X'))?U?m/21
J((W,X')?(U/21,U2))?Um1
由(W,X')的联合密度得到(U1,U2)的联合密度为
U(n?m?p?1)/21exp{?1tr(U'(n?p?1)/21)}Ip?U2U2(n?m)p/222?(n/2)?mp/2,U1?0p(13)
(2)由(U1,U2)的联合密度知U1与U2相互独立.显然,
U'1?W?XX~Wp(n?m,Ip),U1的密度函数为
U(n?m?p?1)/21exp{?1tr(U1)}(m?n)p/22 2?p((n?m)/2), 故U2的密度函数为
47
14)
(?p((n?m)/2)?p(n/2)?mp/2Ip?U2U/(n?p?1)/2 . 2(15)
三、Wilks分布的密度函数推导:
由概率论的知识知:若(?1,?2)的联合密度函数为f?1,?2(x1,x2),则密度函数为:
??1(设?2?0)的?2f?1(x)??2???f??(xx,x1,212)|x2|dx2 (16)
特别的,当?1,?2独立时,有
?f?1(x)??2???f?(xx)?f?(x)|x11222|dx2 (17)
已知W的密度函数为:
e?a/2|W|(n?p?1)/2exp{?tr(W)/2}2(np)/2?p(p?1)/4??((n?i?1)/2)i?1p1?(n/2)aw11k() (18) ?k!?(n/2?k)4k?0?根据公式(11),(14),(17),(18)可以得到Wilks的密度公式。
/(3)由于??Ip?U2U2,所以?的h阶矩为
/h2E(?)??hIp?U2U?p((n?m)/2)?p(n/2)?mp/2/Ip?U2U2(n?p?1)/2dU
=
?p((n?m)/2)?p(n/2)p?p((n?2h)/2)?p((n?2h?m)/2)p
=
??((n?m?i?1)/2)??((n?2h?i?1)/2)i?1i?1??((n?i?1)/2)??((n?2h?m?i?1)/2)i?1i?1pp. (19)
比较(9)式与(19)式.由此可见,?与B1B2?Bp的各阶距都相等,所以?与
B1B2?Bp同分布.由于?~?p,n,m,所以性质1得到证明.
利用性质1并计算等式两边的矩,可以证得Wilks分布的另一些基本性质,见下面的性质2和性质3。
48
性质2
?p,n,m?d?m,n?m?p,p?
化为?
在m?p时,通常根据性质2将?性质3 (1)?2r,n,mp,n,mm,n?m?p,p??Bd21··,r. ?Br2,B1,B2,?,Br相互独立,Bi~?(n?1?2i,m),i=1,·
(2)?2r?1,n,m?Bd21···,Br,Br?1相互独立,?Br2Br?1,其中B1,B2,
Bi~?(n?1?2i,m),i=1,···,r; Br?1~?((n?2r)/2,m/2).
在p=1,2或m=1,2时,Wilks分布可转换为F分布,其分布函数的计算比较简单。 (1) p=1时,由性质1知?~?(n/2,m/2),所以
1,n,mnm1??1,n,m?1,n,md~F(m,n). (20)
(2) m=1时,由性质2知?p,n,1??1,n?1?p,p~?((n?1?p)/2,p/2),所以
~ F(p,n+1-p). (21)
n?1?p
p(3)p=2时,由性质3知?n?1
m1??p,n,1?p,n,12,n,m~?(n?1,m),所以
1???2,n,m ~ F(2m,2(n?1)). (22)
2,n,m(4)m=2时,由性质2知?
p,n,2??2,n?2?p,p,从而由性质3知
d?p,n,2~?(n?1?p,p),所以
1???p,n,2n?1?p
p~ F(2p,2(n?1?p)) (23)
p,n,249
在p?3或m?3时,Wilks分布的分布函数的精确计算很是困难。
性质3可以概括整理为下表:
表(1) ?(p,n,m)与F分布的关系(n?p)
p m 1 2 任意 任意 服从F分布的统计量 n?p?11?? p?自由度 (p,n?p?1) 任意 任意 1 2 n?p1?? p?n1?? m?(2p,2(n?p)) (m,n) n?11?? m?(2m,2(n?1)) 另外,对于p和m的其他值,当n充分大时,可用下列渐进分布,即设
12,其中r?n?(p?m?1),这?~?(p,n,m),则当n??时,由?rln???pm2就是著名的Bartlett逼近。
四、Wilks分布的渐进展开
在p和m给定,n??时讨论Wilks分布?p,n,m的分布函数的渐进展开。首先讨论?nln(?p,n,m)的分布函数的渐进展开,然后讨论?n?ln(?p,n,m)的分布函数的渐进展开,其中,?待定,用以提高Wilks分布?p,n,m的分布函数的渐进计算的精度。
一、?nln(?p,m,m)分布的渐进展开
Wilks分布的?p,n,m的h(h?0,1,2,?)阶矩的计算公式
E(?p,n,m)h???((n?m?j?1)/2)??((n?j?1)/2?h)j?1j?1pp??((n?j?1)/2)??((n?m?j?1)/2?h)j?1j?1pp (4.1)
利用这个公式首先得到?nln(?p,n,m)的特征函数的展开式,然后基于这个特征函数的展开式得到?nln(?p,n,m)的分布函数的渐近展开。
50
正在阅读:
卡方分布及其它分布12-22
骨骼肌肉系统见习二-基本病变06-02
xxx大学“数字化校园”整体方案建议书v1(微软解决方案)05-19
廉政警示教育片《双面人生》观后感09-20
银川二中2012届高三模拟试题(一)11-10
基本初等函数练习题06-20
林地承包合同书03-14
泰安市众诚矿山自动化有限公司03-20
- exercise2
- 铅锌矿详查地质设计 - 图文
- 厨余垃圾、餐厨垃圾堆肥系统设计方案
- 陈明珠开题报告
- 化工原理精选例题
- 政府形象宣传册营销案例
- 小学一至三年级语文阅读专项练习题
- 2014.民诉 期末考试 复习题
- 巅峰智业 - 做好顶层设计对建设城市的重要意义
- (三起)冀教版三年级英语上册Unit4 Lesson24练习题及答案
- 2017年实心轮胎现状及发展趋势分析(目录)
- 基于GIS的农用地定级技术研究定稿
- 2017-2022年中国医疗保健市场调查与市场前景预测报告(目录) - 图文
- 作业
- OFDM技术仿真(MATLAB代码) - 图文
- Android工程师笔试题及答案
- 生命密码联合密码
- 空间地上权若干法律问题探究
- 江苏学业水平测试《机械基础》模拟试题
- 选课走班实施方案
- 分布
- 其它
- 公路隧道开挖爆破详细设计
- 《把创意变成创业计划书》教学设计
- 论转型时期中国社会阶层分化的总趋向及其对策研究
- 关于当前维护农村社会稳定问题的研究
- 六年级科学12册第三单元(宇宙)复习题
- 好朋友,永远不氧化!燕京啤酒粤西攻略
- 湘里人家餐厅促销策划
- 如何设计热轧盘圆纯材项目可行性研究报告(技术工艺+设备选型+财务概算+厂区规划)标准方案
- M浅谈多媒体技术在初中历史教学中的应用
- 最新高考语文学业水平测试一轮复习专题十二论述类文本阅读知识整合 - 图文
- 2018年6月广东省普通高中学业水平考试化学试卷
- 2011年公务员考试备考:村官面试真题-村官面试题汇总
- 2019关于散居困难职工低保状况的调查报告
- 高三一模地理质量分析
- 安庆市蔬菜种植农场数据报告2018版
- 商务谈判中的礼仪
- 长柄扁桃仁的营养成分分析
- 2015浙教版七年级数学上册期中检测题及答案解析
- 自动重合闸前加速保护实验
- 解剖题题库(含答案)