应用多元分析期末复习练习题 - 图文

更新时间:2023-11-04 09:08:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

多元复习

1、多元统计分析是运用数理统计方法来解决多指标问题的理论和方法。 2、多元分析研究的是多个随机变量及相关关系的统计总体。

3、如果A与B是两个P×P维的方阵,则AB与BA有完全相同的特征值。 4、随机向量X的协方差矩阵一定是非负定矩阵。

5、若A为P阶对称矩阵,则存在正交矩阵T与对角矩阵∧,则三者的关系有A=T∧T’。 6、设x是多元向量,服从正太分布即X~即a’x~

,a为P维常熟向量,则其线性型a’x服从一元正态分布,

7、方差相同的两个随机变量的差与和是不相关关系。

8、协方差和相关系数是变量间离散程度的一种变量,并不能刻画变量间可能存在的关联程度的关系。 9、变量的类型按尺度划分为间隔变量、有序变量、 名义变量类型。 10、公共因子方差与特殊因子方差之和为1。

11、聚类分析是建立一种分析方法,它将一批样品或变量按照它们在性质上的亲疏关系进行科学的分类。 12、聚类分析是分析如何对样品或变量进行量化分析,通常分为Q型聚类和R型聚类。 13、聚类分析中Q型聚类是对样品进行聚类,R型聚类是对变量进行聚类。

14、进行判别分析时,通常指定一种判别规则用来判定新样品的归属,常见的判别准则有:费希尔判别准

则、贝叶斯判别准则。 15、费希尔判别法就是要找P个变量组成的线性判别函数使得各组内点的离差尽可能接近,而不同组间的

点尽可能疏远。 16、当X~

,则

-)服从卡方分布,即

-) ~

17、威尔克斯统计量表达式:∧=。

18、霍特林统计量表达式: 。

19、两个变量间的平方马氏距离:

;总体的马氏距离:

20、方差相等的两个随机变量的关系: 。

21、几个变量间服从正态分布,各自独立,样品的均值向量服从正态分布。 22、从代数观点看主成分是P个原始相关变量的线性组合。 23、变量共同度是指因子载荷矩阵中的第i行元素的平方和。

24、因子分析是指把每个原始变量分为两部分因素,一部分是公共因子,另一部分是特殊因子。

1、判别分析的目标。

答:判别分析的目标有两个:一是根据已知所属组的样本给出判别函数,并制定判别规则,再依此判断(或

预测)每一新样品应归属的组别。另一是用图形法或代数法描述各组样品之间的差异性,尽可能地分离开各组。 2、费希尔判别的基本思想、目的、主要方法有哪些?

答:费希尔判别的基本思想是投影(或降维),用几个费希尔判别函数或典型变量来代替P个原始变量,以

达到降维的目的。并根据这r个判别函数对样品的归属作出判别或将各组分离。各个判别函数都具有单位方差,且彼此不相关。判别函数的方向并不正交,而作图时仍将它们画成直角坐标系,从直观的几何图上进行判别,区别各组,这是费希尔判别的重要应用。为作图时的需要,通常取判别函数个数r=2或3。 3、聚类分析与判别分析的区别与联系。

答:判别分析和聚类分析都是研究事物分类(或组)的基本方法,但它们却有着不同的分类目的,彼此之

间既有本质的区别又有一定的联系。 它们的本质区别在于:在于判别分析中,组的数目是已知的 ,我们将样品分配给事先已定义好的组(或

类)之一;而聚类分析中,无论是类的数目还是类的本身在事先都是未知的。 它们的联系在于:如果组不是已有的,则对组的事先了解和形成有时可以通过聚类分析探索得到;还

有,聚类分析的效果往往也可以通过由前两个(或三个)费希尔判别函数得分产生的散点图(或旋转图)从直觉上进行评估。 4、主成分的应用分类。

答:主成分的应用可分为两类:(1)在一些应用中,这些主成分本身就是分析的目标,此时需要给(用来

降维的)前几个只成分一个符合实际背景和意义的解释,以明白其大致的含义。(2)在更多的另一些应用中,主成分只是要达到目标的一个中间结果(或步骤),而非目标本身。 5、主成分与原始变量间的关系。

答(1)主成分保留了原始变量绝大多数信息。 (2)主成分的个数远远少于原始变量的数目。 (3)各个主成分之间互不相关。

(4)每个主成分都是原始变量的线性组合。

6、因子分析与主成分分析的区别与联系。

答:(1)主成分涉及的只是一般的变量变换,它不能作为一个模型来描述,本质上几乎不需要任何假定;

而因子分析需要构造一个因子模型,并伴随有几个关键性的假定。 (2)主成分是原始变量的线性组合;而在因子分析中,原始变量是因子的线性组合,但因子却一般不

能表示为原始变量的线性组合。 (3)在主成分分析中,强调的是用少数几个主成分解释总方差;而因子分析中,强调的是用少数几个

因子去描述协方差或相关关系。 (4)主成分的解释是唯一的(除非含有相同的特征值或特征向量为相反符号);而因子的解可以有很多,

表现的比较灵活(主要体现在因子旋转上)。这种灵活性使得变量在降维后更易得到解释,这是因子分析比主成分分析更广泛应用的一个重要原因。 (5)主成分不会因其提取个数的改变而变化,但因子分析往往会随模型中因子个数的不同而变化。

1、正交因子模型的不受单位的影响。 证明:将x的单位做变化,通常是作一变换x*?cx,这里的

gc1,c2,....cp),ci?0,i?1,2,...p. c?dia(,于是

* x?c??cAf?c?

令?*?c?,A*?cA,?*?c?,则有:

x*??*?A*f??*

这个模型能满足假定式的假定,即:

?E(f)?0?*E(?)?0?? V(f)?I??**V(?)?D?*?c??0?cov(f,?)?cov(f,?)其中D**2*2?diag(?1*2,?2,.....?p),?i*2?ci2?i2,i=1,2,….p。

因此,单位变换后新的模型仍为正交因子模型。

2、正交因子模型的因子载荷是不唯一的。 证明:设T为任意mxm正交矩阵,令A*?AT,f*?T?f,则模型x???Af??,能表示为

x???A*f*??。

E(f)?0 因为:E(f)?T?*V(f)T?T?T?I V(f)?T?(f,?)?E(f,??)?T?E(f,??)?0 Cov***?E(f)?0?E(?)?0??所以仍满足条件:? V(f)?I?222V(?)?D?diag((?,?,.....?)12p??cov(f,?)?E(f,??)?0?A??V(?)?AA??D或x???A*f从??V(Af)?V(?)?AV(f)可以分解为??*??都可以看出?也

A*A*?D

?显然,因子载荷矩阵A不是唯一的。

?1~x2(p)。 3、性质(7)设X~NP(?,?),??0,则(x??)??(x??)证明:令y??(x??121) ?),于是y~NP(0,yp独立同分布于N(0,1) 所以y1,y2,y3.....所以由卡方分布的定义知:

(x??)???1(x??)?y?y?y1?y2?....?yp~x2(p)

2224、设随机变量

x?(?1,?2,?3)?有密度函数

?1?0?x1,x2,x3?2?f(x1,x2,x3)??8?3(1?sinx1sinx2sinx3),试证x1,x2,x3两两独立但不?0,其他?互相独立。 证明:f1(x1,)?????????f(x1,x2,x3)dx2dx3

=

??02?2?18?0dx2dx3?3??02?2?18?30sinx1sinx2sinx3dx2dx3

2?2?11sinx1?sinx2dx2?sinx3dx3 ? =

002?8?3 =

1 2?11,f3(x3)? 2?2?同理:f2(x2)?f(x1,,x2)? ???0???f(x1,x2,x3)dx3

18?32?(1?sinx1sinx2sinx3)dx3

??2?18?0dx3?318?3?2?0sinx1sinx2sinx3dx3

?14?2

同理:f(x1,,x3)?14?2,f(x2,x3)?14?2

f2(x2),f(x1,,x3)?f1(x1)f3(x3),f(x2,x3)?f2(x2)f3(x3),从而f(x1,,x2)?f1(x1)f(x1,x2,x3)?f1(x1)f2(x2)f3(x3)

所以x1,x2,x3两两独立但不互相独立。

本文来源:https://www.bwwdw.com/article/26w2.html

Top