应用多元统计分析课后答案 - 朱建平版

更新时间：2023-12-04 10:17:01 阅读量：教育文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

应用多元统计分析课后答案推荐度：
相关推荐

2.1.试叙述多元联合分布和边际分布之间的关系。

解：多元联合分布讨论多个随机变量联合到一起的概率分布状况，度函数是一个p维的函数，而边际分布讨论是函数的维数小于p。 2.2设二维随机向量(X1X?(X1,X2,?Xp)?的联合分布密

X?(X1,X2,?Xp)?的子向量的概率分布，其概率密度

X2)?服从二元正态分布，写出其联合分布。

2???12?1?2??，协方差矩阵为?，则其联合分布密2???21?2?解：设(X1度函数为

X2)?的均值向量为μ???12?1???1?12?f(x)????2??2????21?2?2?1/2?12?????1?12?1?exp??(x?μ)??(x?μ)?。 2?2???212?????2.3已知随机向量(X1X2)?的联合密度函数为

f(x1,x2)?其中a?2[(d?c)(x1?a)?(b?a)(x2?c)?2(x1?a)(x2?c)]

(b?a)2(d?c)2x1?b，c?x2?d。求

X1和X2的边缘密度函数、均值和方差； X1和X2的协方差和相关系数；

（1）随机变量（2）随机变量（3）判断

X1和X2是否相互独立。

X1和X2的边缘密度函数、均值和方差；

（1）解：随机变量

dfx1(x1)??c2[(d?c)(x1?a)?(b?a)(x2?c)?2(x1?a)(x2?c)]dx

(b?a)2(d?c)2d

2(d?c)(x1?a)x2?(b?a)2(d?c)22(d?c)(x1?a)x2?(b?a)2(d?c)22(d?c)(x1?a)x2?(b?a)2(d?c)2cd????dc2[(b?a)(x2?c)?2(x1?a)(x2?c)]dx2

(b?a)2(d?c)22[(b?a)t?2(x1?a)t]dt 22(b?a)(d?c)d?cd?ccd0c[(b?a)t2?2(x1?a)t2]?(b?a)2(d?c)20?1 b?a2b?a?b?a?所以由于X1服从均匀分布，则均值为，方差为212。

同理，由于

X2服从均匀分布

?1?fx2(x2)??d?c??0x1??c,d?其它，则均值为

d?c，方差2?d?c?为

122。

（2）解：随机变量

X1和X2的协方差和相关系数；

cov(x1,x2)??

dbca?b??d?c?2[(d?c)(x1?a)?(b?a)(x2?c)?2(x1?a)(x2?c)]?x?x?dx1dx21??2?22?a?22(b?a)(d?c)?????(c?d)(b?a)

36??cov(x1,x2)?x?x1?21 3（3）解：判断

X1和X2是否相互独立。

X1和X2由于f(x1,x2)?fx1(x1)fx2(x2)，所以不独立。

2.4设

X?(X1,X2,?Xp)?服从正态分布，已知其协方差矩阵?为对角阵，证明其分量是相互独立的随

机变量。

解：因为

X?(X1,X2,?Xp)?的密度函数为

p?1??1/2?1??1?f(x1,...,xp)??Σexp?(x?μ)Σ(x?μ)?? ??2??2????12???2?2??

又由于Σ??????2???p??22 Σ??12?2??p?1??2?1??Σ?1???????12?2?????? 则f(x1,...,xp) ???1?2??p???1???2??1??p?1/2?1?1??222?1???Σ?????exp?(x?μ)Σ??12p??2?2????????????

12?2??????????(x?μ)???????1??2???p??p222??11(xp??p)??1??1(x1??1)1(x2??3)???????exp???...????? 12p?2222?2?2?2?????12p???(xi??i)2?1??exp????f(x1)...f(xp) 则其分量是相互独立。 22?i?i?1?i2??p2.6 渐近无偏性、有效性和一致性； 2.7 设总体服从正态分布，X~Np(μ,Σ)，有样本X1,X2,...,Xn。由于X是相互独立的正态分布随

机向量之和，所以X也服从正态分布。又

n?n?nE(X)?E??Xin???E?Xi?n??μn?μi?1?i?1?i?11nΣ?n?1nD(X)?D??Xin??2?D?Xi??2?Σ? 所以X~Np(μ,Σ)。

ni?1n?i?1?ni?12.8 方法1：

nn11???Σ(Xi?X)(Xi?X)??XiX???i?nXX n?1i?1n?1i?1n11?n?????E(Σ)?E(?XiX??nXX)?EXX?nEXX?????iii? n?1i?1n?1??i?1?

1?nΣ?1?Σ?n?(n?1)Σ?Σ。 ???n?1?i?1n?n?1方法2：S?

?????(Xi-X)(Xi-X)????X-μ?(X?μ)X-μ?(X?μ)?i??i?i?1i?1nnnn

??(Xi-μ)(Xi-μ)??2?(Xi-μ)(X-μ)??n(X?μ)(Xμ?Xμ)?

i?1i?1

??(Xi-μ)(Xi-μ)??2n(X?μ)(X?μ)??n(X?μ)(X?μ)?

i?1nn

??(Xi-μ)(Xi-μ)??n(X?μ)(X?μ)?

i?1S1?n?E()?E??(Xi-μ)(Xi-μ)??n(X?μ)(X?μ)?? n?1n?1?i?1?

1?n?E(Xi-μ)X(i-μ?)?nEX(?μ)(X?μ??n?1?i?1S???)?Σ。故为Σ的无偏估计。

n?1?2.9.设X(1),X(2),...,X(n)是从多元正态分布X~Np(μ,Σ)抽出的一个简单随机样本，试求S的分布。

???证明：设Γ??????令Ζ=(Ζ1***1n***1n????*??*?*??(?ij)为一正交矩阵，即Γ?Γ?I。 ?1??n?Ζ2?Ζn)=?X1X2?Xn?Γ?，

由于Xi(i?1,2,3,4,?n)独立同正态分布,且Γ为正交矩阵

所以???(?1?2??n)独立同正态分布。且有

1n，E(Ζn)??E(Χi)?nμ，Var(Zn)?Σ。

ni?11nΖn??Χini?1nE(Ζa)?E(?rajΧj)j?1(a?1,2,3,?,n?1)

?n?rajj?1nn1?rnj?0 μ ?nμ?rajni?1Var(Ζa)?Var(?rajΧj)

j?1n2??rVar?Χj??Σ?raj?Σ

2ajj?1j?1nn所以Ζ1Ζ2?Ζn?1独立同N(0,Σ)分布。又因为S??(Xj?X)(Xj?X)?

i?1n??XjX?j?nXX?

j?1n1n1n?????Xi??nXi??ZnZ?因为nXX??n?n??n ni?1??ni?1??n又因为

?XX???Xjjj?11X2???X1???X???Xn??2???X1????X???n?X2?X?1????X?Xn?Γ?Γ?2?

?????X????n???Z1Z2?Z?1????Z2???Zn? ?????Z????n?nnjjnn1122nnnn所以原式

?XX??ZZ???ZZ??ZZ??ZZ??ZZ??...?ZZ?-ΖΖ?

jjnj?1j?1n故S???j??j，由于Z1,Z2,?,Zn?1独立同正态分布Np(0,Σ)，所以

j?1n?1j?1n?1S???j??j~Wp(n?1,?)

2.10.设

Xi(ni?p)是来自Np(μi,Σi)的简单随机样本，i?1,2,3,?,k，

?μ2?...?μk?μ且Σ1?Σ2?...?Σk?Σ，求μ和Σ的估计。 ?Σ2?...?Σk?Σ求μ1,μ2,...,,μk和Σ的估计。

（1）已知μ1（2）已知Σ1?解：（1）μ?x?1n1?n2?...?nk??xa?1i?1pknaai，

??Σ???xa?1i?1knaai?x??xia?x??

n1?n2?...?nk (2)

lnL(μ1,?,μk,Σ)?ln??(2?)Σ???n21knaaexp[???(xi-μa)?Σ-1(xia-μa)]

2a?1i?1

1n1knaalnL(μ,Σ)??pnln(2?)?lnΣ???(xi-μa)?Σ-1(xia-μa)

222a?1i?12?lnL(μ,Σ)n?11kna??Σ???(Xia?μa)(Xia?μa)??Σ?1??0

?Σ22a?1i?1?lnL(μj,Σ)?μj??Σ?1(Xij?μj)?0(j?1,2,...,k) 解之，得

i?1nj?j?xj?μ1nj?xi?1njij??，Σ???xj?1i?1knjij?xj??xij?xj??

n1?n2?...?nk第三章

3.1 试述多元统计分析中的各种均值向量和协差阵检验的基本思想和步骤。其基本思想和步骤均可归纳为：

第一，提出待检验的假设

和H1；第二，给出检验的统计量及其服从的分布；

第三，给定检验水平，查统计量的分布表，确定相应的临界值，从而得到否定域；

第四，根据样本观测值计算出统计量的值，看是否落入否定域中，以便对待判假设做出决策（拒绝或接受）。

均值向量的检验：

统计量拒绝域

均值向量的检验：在单一变量中

当?已知 z2?(X??0)?n |z|?z?/2

当?未知 t2?(X??0)n |t|?t?/2(n?1)

S1n （S?(Xi?X)2作为?2的估计量） ?n?1i?12 一个正态总体H0：μ?μ0 协差阵Σ已知 T022 ?n(X?μ0)?Σ?1(X?μ0)~?2(p) T02???协差阵Σ未知

(n?1)?p?12n?p2T~F(p,n?p) T?F?

(n?1)p(n?1)p2 （T?(n?1)[n(X?μ0)?S?1n(X?μ0)]）

两个正态总体H0：μ1有共同已知协差阵

?μ2

n?m?Σ?1X(X?Y)(?Y)?~n?m2T02?22p( ) T0???

有共同未知协差阵

F?(n?m?2)?p?12T~F(p,n?(n?m?2)p2m? p?1) F?F?

?n?m???1?n?m?（其中 T?(n?m?2)?(X?Y)?S?(X?Y)?）

?n?m??n?m?协差阵不等n?m

F?(n?p)nZ?S-1Z~F(p,n?p) F?F? p(n?p)nZ?S-1Z~F(p,n?p) F?F? p协差阵不等n?m 多个正态总体H0：?1F???2????k

SSA(k?1)~F(k?1,n?k) F?F?

SSE(n?k)单因素方差

F?多因素方差

??ET?EA?E~?(p,n?k,k?1)

协差阵的检验检验Σ?Σ0

H0：Σ?Ip

?1?n/2?e???exp??trS?S???2??n?np/2

H0：Σ?Σ0?Ip

检验Σ1?1?n/2?e???exp??trS*?S*???2??n?np/2

?Σ2???ΣkH0：Σ1?Σ2???Σk

统计量?k?nnp/2?Si?1kni/2iSn/2?ni?1kipni/2

3.2 试述多元统计中霍特林

分布和威尔克斯分布分别与一元统计中t分布和F分布的关系。

答：（！）霍特林分布是t分布对于多元变量的推广。

n(X??)2t??n(X??)?(S2)?1(X??)而若设X~Np(μ,Σ)，S~Wp(n,Σ)且X与S2S2相互独立，n若

?p，则称统计量

，

的分布为非中心霍特林T分布。

且

X~Np(0,Σ)S~Wp(n,Σ)X

与

S相互独立，令

T2?nX?S?1X，则

n?p?12。 T~F(pn,?p?1 )np（2）威尔克斯分布在实际应用中经常把统计量化为T统计量进而化为F统计量，利用F统计量来解决多元统计分析中有关检验问题。

?与Fp 统计量的关系 n1 任意 n2 1 F统计量及分别任意 n1?p?11??(p,n1,1)?~F(p,n1?p?1) p?(p,n1,1)n1?p1??(p,n1,2)?~F(2p,2(n1?p)) p?(p,n1,2)任意任意 2 1 任意任意 n11??(1,n1,n2)?~F(n2,n1) n2?(1,n1,n2)n1?11??(2,n1,n2)?~F(2n2,2(n1?1)) n2?(2,n1,n2)2 任意任意 3.3 试述威尔克斯统计量在多元方差分析中的重要意义。答：威尔克斯统计量在多元方差分析中是用于检验均值的统计量。

H0：μ1?μ2???μk H1：至少存在i?j使μi?μj

用似然比原则构成的检验统计量为

??ET?EA?E 给定检验水平?，查~?(p,n?k,k?1)Wilks分布表，确定临界值，然后作出统计判断。

第四章

4.1 简述欧几里得距离与马氏距离的区别和联系。答：设p维欧几里得空间

中的两点X=

和Y=

。则欧几里得距离为

。欧几里得距离的局限有①在多元数据分析中，其度量不合理。②会受到实际问题中量纲

的影响。

设X,Y是来自均值向量为

，协方差为

的总体G中的p维样本。则马氏距离为

D(X,Y)=

即欧几里得距离。

。当即单位阵时，D(X,Y)==

因此，在一定程度上，欧几里得距离是马氏距离的特殊情况，马氏距离是欧几里得距离的推广。 4.2 试述判别分析的实质。

答：判别分析就是希望利用已经测得的变量数据，找出一种判别函数，使得这一函数具有某种最优性质，能把属于不同类别的样本点尽可能地区别开来。设R1，R2，?，Rk是p维空间R p的k个子集，如果它们

互不相交，且它们的和集为，则称为的一个划分。判别分析问题实质上就是在某种意

义上，以最优的性质对p维空间构造一个“划分”，这个“划分”就构成了一个判别规则。

4.3 简述距离判别法的基本思想和方法。

答：距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。其基本思想都是分别计算样本与各个总体的距离（马氏距离），将距离近的判别为一类。 ①两个总体的距离判别问题

设有协方差矩阵∑相等的两个总体G1和G2，其均值分别是?1和? 2，对于一个新的样品X，要判断它来自哪个总体。计算新样品X到两个总体的马氏距离D（X，G1）和D（X，G2），则 X X

22，D（X，G1）

22D2（X，G2）

，D（X，G1）> D（X，G2，

具体分析，

D2(X,G1)?D2(X,G2)?(X?μ1)?Σ?1(X?μ1)?(X?μ2)?Σ?1(X?μ2)?1?Σ?1μ1?(X?Σ?1X?2X?Σ?1μ2?μ??X?Σ?1X?2X?Σ?1μ1?μ12Σμ2)?1?Σ?1μ1?μ??2X?Σ?1(μ2?μ1)?μ12Σμ2

?2X?Σ?1(μ2?μ1)?(μ1?μ2)?Σ?1(μ1?μ2)?μ1?μ2??1???2?X? ?Σ(μ1?μ2)2????2(X?μ)?α??2α?(X?μ)记W(X)?α?(X?μ) 则判别规则为

X X

，W(X)，W(X)<0

②多个总体的判别问题。

设有k个总体G1,G2,?,Gk，其均值和协方差矩阵分别是μ1,μ2,?,μk和

Σ1,Σ2,?,Σk，且

Σ1?Σ2???Σk?Σ。计算样本到每个总体的马氏距离，到哪个总体的距离最小就属于哪个总体。具体分析，D2(X,G?)?(X?μ?)?Σ?1(X?μ?)

?Σ?1X?μ??Σ?1μ??X?Σ?1X?2μ??X?C?)?X?ΣX?2(I?取I??11?1?Σ?1μ?，C???μ??Σμ?，??1,2,?,k。

2?1,2,?,k

?X?C?， ?可以取线性判别函数为 W?(X)?I?相应的判别规则为X?Gi 若 Wi(X)1???k?X?C?) ?max(I?4.4 简述贝叶斯判别法的基本思想和方法。

基本思想：设k个总体G1,G2,?,Gk，其各自的分布密度函数

kf1(x),f2(x),?,fk(x)，假设k个总体各

自出现的概率分别为q1,q2,?,qk，qi?0，?qi?1。设将本来属于Gi总体的样品错判到总体Gj时

i?1造成的损失为C(j|i)，i,j?1,2,?,k。

p维样本空间为 R?(R1,R2,?,Rk)。

设k个总体G1,G2,?,Gk相应的

在规则R下，将属于Gi的样品错判为Gj的概率为

P(j|i,R)??fi(x)dx i,j?1,2,?,kRji?j

则这种判别规则下样品错判后所造成的平均损失为

r(i|R)??[C(j|i)P(j|i,R)] i?1,2,?,k

j?1k则用规则R来进行判别所造成的总平均损失为g(R)??qir(i,R)?i?1k?q?C(j|i)P(j|i,R)

ii?1j?1kk贝叶斯判别法则，就是要选择一种划分R1,R2,?,Rk，使总平均损失g(R)达到极小。

基本方法：g(R)??qi?C(j|i)P(j|i,R)??qi?C(j|i)?fi(x)dx

i?1j?1i?1j?1Rjkkkkk???(?qiC(j|i)fi(x))dx 令?qiC(j|i)fi(x)?hj(x)，则 g(R)???hj(x)dx

j?1Rji?1i?1kkkj?1Rj

若有另一划分R*?(R,R,?,R)，g(R)???*hj(x)dx

*1*2*k*kj?1Rj则在两种划分下的总平均损失之差为 g(R)?g(R)????*i?1j?1kkRi?R*j[hi(x)?hj(x)]dx

因为在Ri上hi(x)?hj(x)对一切

j成立，故上式小于或等于零，是贝叶斯判别的解。

Ri?{x|hi(x)?minhj(x)}R?(R,R,?,R)i?1,2,?,k 1?j?k12k从而得到的划分为

4.5 简述费希尔判别法的基本思想和方法。答：基本思想：从k个总体中抽取具有函数

p个指标的样品观测数据，借助方差分析的思想构造一个线性判别

U(X)?u1X1?u2X2???upXp?u?X

系数u?(u1,u2,?,up)?可使得总体之间区别最大，而使每个总体内部的离差最小。将新样品的p个

指标值代入线性判别函数式中求出U(X)值，然后根据判别一定的规则，就可以判别新的样品属于哪个总体。

4.6 试析距离判别法、贝叶斯判别法和费希尔判别法的异同。

答：① 费希尔判别与距离判别对判别变量的分布类型无要求。二者只是要求有各类母体的两阶矩存在。而贝叶斯判别必须知道判别变量的分布类型。因此前两者相对来说较为简单。 ② 当k=2时，若判别也等价。 ③ 当别不同。

④ 距离判别可以看为贝叶斯判别的特殊情形。贝叶斯判别的判别规则是 X

，W(X)

则费希尔判别与距离判别等价。当判别变量服从正态分布时，二者与贝叶斯

时，费希尔判别用作为共同协差阵，实际看成等协差阵，此与距离判别、贝叶斯判

，W(X)

距离判别的判别规则是 X X

，W(X)，W(X)<0

二者的区别在于阈值点。当q1?q2，C(1|2)?C(2|1)时，d?1，lnd和

?0。二者完全相同。

4.7 设有两个二元总体，从中分别抽取样本计算得到

,, 假设，试用距离判别法建立判别函数和判别规则。

样品X=（6，0）’应属于哪个总体？

解：= ，= ， ==

，

即样品X属于总体

第五章

5.1 判别分析和聚类分析有何区别？

答：即根据一定的判别准则，判定一个样本归属于哪一类。具体而言，设有n个样本，对每个样本测得p项指标（变量）的数据，已知每个样本属于k个类别（或总体）中的某一类，通过找出一个最优的划分，使得不同类别的样本尽可能地区别开，并判别该样本属于哪个总体。聚类分析是分析如何对样品（或变量）进行量化分类的问题。在聚类之前，我们并不知道总体，而是通过一次次的聚类，使相近的样品（或变量）聚合形成总体。通俗来讲，判别分析是在已知有多少类及是什么类的情况下进行分类，而聚类分析是在不知道类的情况下进行分类。 5.2 试述系统聚类的基本思想。

答：系统聚类的基本思想是：距离相近的样品（或变量）先聚成类，距离相远的后聚成类，过程一直进行下去，每个样品（或变量）总能聚到合适的类中。

5.3 对样品和变量进行聚类分析时，所构造的统计量分别是什么？简要说明为什么这样构造？

答：对样品进行聚类分析时，用距离来测定样品之间的相似程度。因为我们把n个样本看作p维空间的n个点。点之间的距离即可代表样品间的相似度。常用的距离为

（一）闵可夫斯基距离：q取不同值，分为

dij(q)?(?Xik?Xjk)k?1ppq1/q

（1）绝对距离（q?1），

dij(1)??Xik?Xjkk?1

（2）欧氏距离（q?2），

dij(2)?(?Xik?Xjk)k?1p21/2

（3）切比雪夫距离（（二）马氏距离

q??）

，dij(?)?maxXik?Xjk1?k?p

pX?X1ikjk d ( L ) ? ?ijpk?1Xik?Xjk

（三）兰氏距离

2?1 dij(M)?(Xi?Xj)?Σ(Xi?Xj)

对变量的相似性，我们更多地要了解变量的变化趋势或变化方向，因此用相关性进行衡量。将变量看作p维空间的向量，一般用（一）夹角余弦 cos?ij

（二）相关系数

??Xk?1pk?1pikXjkp 2(?Xik)(?X2jk)k?1 rij??(Xk?1pik?Xi)(Xjk?Xj)p?(Xk?1p ik?Xi)2?(Xjk?Xj)2k?15.4 在进行系统聚类时，不同类间距离计算方法有何区别？选择距离公式应遵循哪些原则？答：设dij表示样品Xi与Xj之间距离，用Dij表示类Gi与Gj之间的距离。（1）. 最短距离法

Dij?mindij Xi?Gi,Xj?GjDkr?mindij?min{Dkp,Dkq}

X?G,X?Gikjr（2）最长距离法

Dpq?Xi?Gp,Xj?Gqmaxdij

Dkr?

Xi?Gk,Xj?Grmaxdij?max{Dkp,Dkq}

（3）中间距离法

121222 Dkr ?Dkp?Dkq??Dpq22其中

（4）重心法

2?(Xp?X Dp))Xrq?(Xp?Xqq?1(npXp?nqXq) nr2Dkr?npnr2Dkp?nqnr?2Dkq?npnqnr22Dpq

（5）类平均法Dpq（6）可变类平均法 D2 kr21npnqXi?GpXj?Gj??nqnr2dij Dkr2?1nknrXi?GkXj?Gr??2dij?npnr2Dkp?nqnr2Dkq

?(1??)(npnrD?2kp22 Dkq)??Dpq其中?是可变的且? <1 （7）可变法

2Dkr?1??222(Dkp?Dkq)??Dpq 其中?是可变的且? <1 2（8）离差平方和法

?St??(Xit?X)X )tt(Xi?tt?1nt

D?2krnk?npnr?nkD?2kpnk?nqnr?nk2Dkq?nk2Dpq

nr?nk通常选择距离公式应注意遵循以下的基本原则：

（1）要考虑所选择的距离公式在实际应用中有明确的意义。如欧氏距离就有非常明确的空间距离概念。马氏距离有消除量纲影响的作用。

（2）要综合考虑对样本观测数据的预处理和将要采用的聚类分析方法。如在进行聚类分析之前已经对变量作了标准化处理，则通常就可采用欧氏距离。

（3）要考虑研究对象的特点和计算量的大小。样品间距离公式的选择是一个比较复杂且带有一定主观性的问题，我们应根据研究对象的特点不同做出具体分折。实际中，聚类分析前不妨试探性地多选择几个距离公式分别进行聚类，然后对聚类分析的结果进行对比分析，以确定最合适的距离测度方法。 5.5试述K均值法与系统聚类法的异同。

答：相同：K—均值法和系统聚类法一样，都是以距离的远近亲疏为标准进行聚类的。

不同：系统聚类对不同的类数产生一系列的聚类结果，而K—均值法只能产生指定类数的聚类结果。具体类数的确定，离不开实践经验的积累；有时也可以借助系统聚类法以一部分样品为对象进行聚类，其结果作为K—均值法确定类数的参考。

5.6 试述K均值法与系统聚类有何区别？试述有序聚类法的基本思想。

答：K均值法的基本思想是将每一个样品分配给最近中心（均值）的类中。系统聚类对不同的类数产生一系列的聚类结果，而K—均值法只能产生指定类数的聚类结果。具体类数的确定，有时也可以借助系统聚类法以一部分样品为对象进行聚类，其结果作为K均值法确定类数的参考。有序聚类就是解决样品的次序不能变动时的聚类分析问题。如果用样品，则每一类必须是这样的形式，即

X(1),X(2),?,X(n)表示n个有序的

X(i),X(i?1),?,X(j)，其中1?i?n,且j?n，简记为

（2）计Gi?{i,i?1,?,j}。在同一类中的样品是次序相邻的。一般的步骤是（1）计算直径{D（i,j）}。算最小分类损失函数{L[p(l,k)]}。(3)确定分类个数k。（4）最优分类。

5.7 检测某类产品的重量，抽了六个样品，每个样品只测了一个指标，分别为1，2，3，6，9，11.试用最短距离法，重心法进行聚类分析。（1）用最短距离法进行聚类分析。采用绝对值距离，计算样品间距离阵

0 1 0 2 1 0

5 4 3 0 8 7 6 3 0 10 9 8 5 2 0

由上表易知中最小元素是于是将，，聚为一类，记为

计算距离阵

3 0 6 3 0 8 5 2 0

中最小元素是=2 于是将，聚为一类，记为

计算样本距离阵

3 0

答：对于因子模型

Xi?ai1F1?ai2F2???aijFj???aimFm??i i?1,2,?,p

?a11?a21因子载荷阵为A???????ap1a12a22?ap2?a1m??a2m???(A,A,?,A)

12m?????apm??Xi与Fj的协方差为：

Cov(Xi,Fj)?Cov(?aikFk??i,Fj)

k?1m=Cov(?ak?1mikFk,Fj)?Cov(?i,Fj)

=aij

若对

Xi作标准化处理，

Fj2i=aij,因此 aij一方面表示Xi对Fj的依赖程度；另一方面也反映了变量

Xi对公共因子的相对重要性。

2??aijj?1m变量共同度hi?1,2,?,p

22 D(Xi)?ai1D(F1)?ai2D(F2)???aimD(Fm)?D(?i)分组成：第一部分为共同度hi，它描述了全部公共因子对变量对变量

22?hi2??i2 说明变量Xi的方差由两部

Xi的总方差所作的贡献，反映了公共因子

Xi的影响程度。第二部分为特殊因子?i对变量Xi的方差的贡献，通常称为个性方差。

X的贡献g2j2??aiji?1p而公共因子Fj对

j?1,2,?,m

表示同一公共因子Fj对各变量所提供的方差贡献之总和，它是衡量每一个公共因子相对重要性的一个尺度。

7.4 在进行因子分析时，为什么要进行因子旋转？最大方差因子旋转的基本思路是什么？

答：因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释。但有时直接根据特征根、特征向量求得的因子载荷阵难以看出公共因子的含义。这种因子模型反而是不利于突出主要矛盾和矛盾的主要方面的，也很难对因子的实际背景进行合理的解释。这时需要通过因子旋转的方法，使每个变量仅在一个公共因子上有较大的载荷，而在其余的公共因子上的载荷比较小。

最大方差旋转法是一种正交旋转的方法，其基本思路为：

①A

其中令

A?AΓ?(a)**ijp?m,p12dij?a/hi dj??dij

pi?1*ijp12A的第j列元素平方的相对方差可定义为Vj??(dij?dj)2 pi?1*②V?V1?V2???Vm

最大方差旋转法就是选择正交矩阵Γ，使得矩阵A所有m个列元素平方的相对方差之和达到最大。 7.5 试分析因子分析模型与线性回归模型的区别与联系。

答：因子分析模型是一种通过显在变量测评潜在变量，通过具体指标测评抽象因子的统计分析方法的模型。而线性回归模型回归分析的目的是设法找出变量间的依存(数量)关系, 用函数关系式表达出来。

因子分析模型中每一个变量都可以表示成公共因子的线性函数与特殊因子之和。即

（i?1Xi?ai1F1?ai2F2???aimFm??i，2,,?p）该模型可用矩阵表示为：X?AF?ε 而回归分析模型中多元线性回归方程模型为：

是偏回归系数，是残差。

因子模型满足：

（1）m?p；（2）Cov(F,ε)?0，即公共因子与特殊因子是不相关的；

其中

是常数项，

0??1?1???I，即各个公共因子不相关且方差为1；（3）DF?D(F)??m?????1??0??120???2?2??，即各个特殊因子不相关，方差不要求相等。（4）D??D(ε)??????20???p??而回归分析模型满足（1）正态性：随机误差（即残差）e服从均值为 0，方差为?的正态分布；（2）等方差：对于所有的自变量x，残差e的条件方差为? ，且?为常数；（3）独立性：在给定自变量x的条件下，残差e的条件期望值为0（本假设又称零均值假设）；（4）无自相关性：各随机误差项e互不相关。

两种模型的联系在于都是线性的。因子分析的过程就是一种线性变换。 7.6 设某客观现象可用X=(

)’来描述，在因子分析时，从约相关阵出发计算出特征值为由于

特征值所对应的公共因子即可，又知（0，0.899，0.4470）’，要求：

（1）计算因子载荷矩阵A，并建立因子模型。（2）计算共同度

。

,所以找前两个

对应的正则化特征向量分别为(0.707,-0.316,0.632)’及

２

（3）计算第一公因子对X 的“贡献”。

解：（1）根据题意，A=

建立因子模型为，（2）

，