多元统计期末复习题

更新时间:2023-03-09 16:40:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

多元数据分析练习题

第二章多元正态的参数估计

一. 判断题

(1)若X?(X1,X2,?,Xp)T~Np(?,?),?是对角矩阵,则X1,X2,?,Xp相互独立。

( )

(2)多元正态分布的任何边缘分布为正态分布,反之也成立。( )

(3)对任意的随机向量X?(X1,X2,?,Xp)来说,其协方差矩阵?是对称矩阵,并且总是半正定的。( )

(4)对标准化的随机向量来说,它的协方差矩阵与原来变量的相关系数阵相同。( ) (5)若X?(X1,X2,?,Xp)X,1nTT~Np(?,?),X,S分别为样本均值和样本协差阵,则

S分别为?,?的无偏估计。( )

二.计算题

?16?T1. 假设随机向量X?(X1,X2,X3)的协方差矩阵为???4???3??1?1数矩阵R。R????2?1???4?1?13121?4??1??

?3?1???T?44?23??2,试求相关系?9??2. 假设随机向量x?(x1,x2)的协方差矩阵为???T?9?1??20?1,令

y1?2x1?x2,y2?x1?x2,试求y?(y1,y2)的协方差矩阵。

?60?????3?327?? ??100.5???0.5?3.假设12?1?0.5X~N3(?,?),A????0.5,其中??(1,2,?1)T,

?2???1???11???2??4?2???1,试求y?Ax的分布。N2(??0??,???22??) ?????4??三.证明题

1.设X(1),X(2),?,X(n)是来自Np(?,?)的随机样本,X为样本均值。试证明:

E(X)??,D(X)?1n?。

1n?12.设X(1),X(2),?,X(n)是来自Np(?,?)的随机样本,

E(1n?1S)??。

试证明: S为样本协差阵。

3.证明:若p维正态随机向量X?(X1,X2,?,Xp)?的协差阵为对角矩阵,则X的各分量是相互独立的随机变量。

第四章判别分析

一.判断题

1.从某种意义上讲,距离判别是Bayes判别的一种特例。( )

2.距离判别的思想是分别计算样本到各个总体的欧几里得距离,根据距离的大小判别样本属于哪个总体。( )

3.量纲的变化对欧几里得距离的计算结果有影响,而马氏距离则克服了这种影响。欧氏距离是马氏距离的一种特例。( )

4.贝叶斯判别法是一种考虑了总体出现的先验概率和误判损失的判别方法。( )

5.在贝叶斯判别法中,R?(R1,R2,?,Rk)是一个划分,hi(x)是将样品误判给总体Gi的加权平均损失,则Ri?{xhi(x)?minhj(x)},i?1,2,?,k。 ( )

1?j?k6.费希尔判别法是借助方差分析的思想构造线性判别函数,使得总体之间区别最大,而使每个个体内部的离差最小。( ) 二.计算题

1.设有两个正态总体G1,G2,已知: ?(1)???,?(2)???,?1???2?5??3???2??2??32??4?1???,??2??11?? 4????(1)建立距离判别法的判别准则;

?1?X?(2)判断:样品:??,应归属于哪一类?x?G2

?3?D(x,G1)?1813(4x1?3x2?4x1x2?4x1?22x2?51),22(答案:

D(x,G2)?)

(x1?4x2?2x1x2?10x1?28x2?52)222.设G1,G2为两个二元总体,从中分别抽取容量为3的样本如下:

x1 x2 3 7 2 4 : G1 4 7

x1 x2 6 9 5 7 :G2 4 8 (1)求两样本的样本均值x(1),x(2)及协方差矩阵S1,S2;

?2TTx(1)?(3,6),x(2)?(5,8)S1???3?3??2??,S?2??16??1?? ?2?(2)假定两总体协方差矩阵相等,记为?,用S1,S2联合估计?;

?1??2??1?1??11?2?1????,?? ???2?2??11?(3)建立距离判别法则;

W(x1,x2)??2(x1?3x2?25),W(x1,x2)?0,x?G1;W(x1,x2)?0,x?G2

TT(4)假设有一新样品x0?(x1,x2)?(2,7),进行距离判别。x?G2

3.已知两总体的概率密度分别为f1(x)和f2(x),且总体的先验分布为p1?0.2,p2?0.8,误判损失为c(21)?50,c(12)?100。 (1)建立Bayes判别准则;

(2)假设有一新样品x0满足f1(x0)?6.3和f2(x0)?0.5,判定x0的归属问题。 4. 假设两总体G1,G2的概率密度分别为f1(x)?1?x,x?1和 f2(x)?1?x?0.5,?0.5?x?1.5。

(1)做出f1(x)和f2(x)的图像。若假定先验概率p1?p2,c(21)?c(12),求Bayes判别区间的临界点;(0.25)

(2)若p1?0.2,p2?0.8,c(21)?c(12),求Bayes判别区间的临界点;(-0.33) 5.假定有G1,G2,G3三个组,已知p1?0.05,p2?0.65,p3?0.30,f1(x0)?0.10和

f2(x0)?0.63,f3(x0)?2.4。

(1)若不计误判损失,判定x0属于哪个组;(G3)(后验概率分别为0.004,0.361,0.635) (2)假定误判代价矩阵为 G1 误判为 G2 G3 真实组 G1 G2 c(11)?0 c(12)?20 c(21)?10 c(22)?0 c(31)?200 c(32)?100

G3 c(13)?60 c(23)?50 c(33)?0 判定x0属于哪个组。(误判的平均损失为51.39,36.05,41.95 G2)

6. 已知两总体的概率密度分别为f1(x)和f2(x),且总体的先验分布为p1?0.6,p2?0.4,误判损失为c(21)?4,c(12)?12。 (1)建立Bayes判别准则;

(2)假设有一新样品x0满足f1(x0)?0.36和f2(x0)?0.24,判定x0的归属问题。(G2) 7.假设先验概率,误判代价及概率密度值已列于下表。试用贝叶斯判别法将样品分到组

G1,G2,G3中的一个。若不考虑误判代价,则判别结果又将如何?

G1 判别为 G2 G3 真实组 G1 G2 G3 c(11)?0 c(12)?400 c(13)?100 p1?0.55 f1(x0)?0.46 c(21)?20 c(22)?0 c(23)?50 p2?0.15 f2(x0)?1.5 c(31)?80 c(32)?200 c(33)?0 p3?0.3 f3(x0)?0.70 先验概率 概率密度 8. 金融分析员需要有两项重要指标来衡量,设总体G1为“金融分析员满足要求”;总体G2为“金融分析员不满足要求”(两个总体均服从正态分布,协差阵相等),今测得两个总体的若干数据,并由这些数据得到

???????1???,??2???,?????6??2?2411?? 4?T?1(1)假设对某一金融分析员进行测量得到两个指标为x?(5,4),判别这一分析员是否能满足这项工作。(满足)

(2)当两组先验概率分别为q1?0.269,q2?0.731,损失相同。问该金融分析员满足要求吗?为什么?(不满足)

第五章聚类分析

一.判断题

1.快速(动态)聚类分析中,分类的个数是确定的,不可改变。( )

2.K均值聚类分析中,样品一旦划入某一类就不可改变。( )

3.判别分析,聚类分析和主成分分析都不要求数据来自正态总体。( ) 4.系统聚类可以对不同的类数产生一系列的聚类结果。( )

5. K均值聚类和系统聚类一样,可以用不同的方法定义点点间的距离。( ) 6. K均值聚类和系统聚类一样,都是以距离的远近亲疏为标准进行聚类的。( ) 二. 计算题

1. 下面是5个样品两两间的距离矩阵

?0?40???690??1710?635????? ??0??D(0)08试用最长距离法作系统聚类,并画出谱系聚类图。

2. 假设有6个样本,每个样本只测量一个指标,数据如表。样本点间使用绝对值距离,类

间使用最长距离,利用系统聚类法对这6个样本进行分类。 要求:(1)写出距离矩阵及类的合并过程;

(2)画出聚类的谱系图;

(3)写出样本分成两类时的结果。

样本编号 1 2 3 4 5 6 指标1 1 2 4 3 -4 -2 3. 假定我们对A,B,C三个样品分别测量两个变量X1和X2得到结果如表:

用快速聚类法将以上样品聚成两类。

样品 A B C X1 5 -1 1 变量 X2 3 1 2

4. 检验某产品的重量,抽了6个样品,每个样品只测了一个指标,分别为1,2,3,6,9,11,试用最短距离法,重心法进行聚类分析。 ?0?105. 考虑下列4个样品的距离矩阵:??112??53???,用最短距离,最长距离法和类平均法??0?04对这4个样品进行聚类,并画出谱系图。

6. 有8个样本,每个样本两个指标,数据如表。样本点间使用欧氏距离,类间使用最短距离法,利用系统聚类法对这8个样本进行分类。 样本编号 指标1 指标2 1 2 5 2 2 3 3 4 4 4 4 3 5 -4 3 6 -2 2 7 -3 2 8 -1 -3

8.利用样本对两组变量X(1),X(2)进行典型相关分析时,即使X(1),X(2)互不相关,也有可

能得到的典型相关变量的协差阵不为零,因而利用样本数据进行典型相关分析时要对原始变量的协差阵是否为零进行检验。( )

9.典型载荷分析是了解每组变量提取的典型变量解释的该组样本总方差的比例,从而定量的测度典型变量所包含的原始信息量的大小;典型冗余分析是指原始变量与典型变量之间的相关性分析。( ) 10.对变量进行相应分析时,应首先检验变量之间的独立性,只有当变量不独立时,进行相应分析才有意义。( )

二.以下是对一对二维变量的典型相关分析的结果,请根据结果回答下列问题。

表1 Canonical Correlations 1 2

表2 Test that remaining correlations are zero

Wilk's Chi-SQ DF Sig. 1 .378 20.930 4.000 .000 2 .997 .062 1.000 .803

表3 Raw Canonical Coefficients for Set-1 表4 Raw Canonical Coefficients for Set-2

1 2 x1 -.057 -.140 x2 -.071 .187

表5 Canonical Loadings for Set-1 表6 Proportion of Variance of Set-1

Explained by Its Own Can. Var.

x1 x2

1 -.935 -.927

2 -.354 .375

CV1-1 CV1-2

Prop .867 .133

Var

y1 y2

1 -.051 -.080

2 -.174 .262

.788 .054

(1)写出两对典型相关变量的相关系数;

(2)应该选几对典型相关变量,为什么?并写出典型相关变量; (3)x1与其典型相关变量的相关系数是多少?

(4)第一组变量被自身的典型变量解释的方差比例是多少? 三.简答题

1.针对典型相关分析而言,简述典型变量与典型相关系数的概念。 2.简述典型相关分析中典型载荷分析及典型冗余分析的内容与作用。

第十章多维标度法

一.判断题

1.古典多维标度法中,若距离矩阵D为欧几里得矩阵,则D的构图唯一。 ( )

2.所有的距离矩阵都是欧几里得矩阵。( ) 3.多维标度分析中,若内积距离阵B的特征根全部大于零,则距离阵D为欧几里得矩阵。( ) 二.计算题

?0???1.假设距离矩阵D??????10310102323103?????,求D的拟合构图。 ?????0??2.给定距离阵D??????10210221012210????,求它的拟合构造点,并说明它是否是欧式型的。 ????三.简答题

1.简述古典多维标度分析的思想。

2.论述古典多维标度法的求解步骤。

本文来源:https://www.bwwdw.com/article/yk8a.html

Top