海南大学应用多元统计分析 复习真题

更新时间:2024-01-16 11:46:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

定义2.1 将p个随机变量X1,X2,,Xp的整体称为p维随机向量,记为X?(X1,X2,,Xp)?。

定义2.2 设X?(X1,X2,,Xp)?是p维随机向量,它的多元分布函数定义为

F(x)?F(X1,X2,,Xp)?P(X1?x1,X2?x2,,Xp?xp) (2.2)

记为X~F(x),其中x?(x1,x2,,xp)??Rp,Rp表示p维欧氏空间。 多维随机向量的统计特性可用它的分布函数来完整地描述。 定义2.3 设X?(X1,X2,,Xp)?是p维随机向量,若存在有限个或可列个p维数向量x1,x2,?,,记P(X?xk)?pk,(k?1,2,)且满足p1?p2???1,则称X为离散型随机向量,称P(X?xk)?pk,(k?1,2,)为X的概率分布。

设X~F(x)?F(x1,x2,,xp),若存在一个非负函数f(x1,x2,?,xp),使得对一切有x?(x1,x2,,xp)??Rpx1xpF(x)?F(x1,x2,,xp)?????f(t1,t2,,tp)dt1dtp(2.3)

??则称X为连续型随机变量,称f(x1,x2,?,xp)为分布密度函数,简称为密度函数或分布密度。

一个p元函数f(x1,x2,?,xp)能作为Rp中某个随机向量的密度函数的主要条件是:

(1)f(x1,x2,?,xp)?0,?(x1,x2,?,xp)??Rp; (2)???f(x1,x2,?,xp)dx1?dxp?1

????????离散型随机向量的统计性质可由它的概率分布完全确定,连续型随机向量的统计性质可由它的分布密度完全确定。 定义2.4 设X?(X1,X2,,Xp)?是p维随机向量,称由它的q(?p)个

12q分量组成的子向量X(i)?(Xi,Xi,,Xi)?的分布为X的边缘(或边际)分布,相对地把X的分布称为联合分布。

当X的分布函数是F(x1,x2,数为:

F(x1,x2,,xq)?P(X1?x1,,xq)时,X(1)的分布函数即边缘分布函

,Xq?xq)

?P(X1?x1,,Xq?xq,Xq?1??,,Xp??) ?F(x1,x2,,xq,?,,?) 当X有分布密度f(x1,x2,?,xp)时(亦称联合分布密度函数),则X(1)也有分布密度,即边缘密度函数为:

????f1(x1,x2,?,xq)????f(x1,?,xp)dxq?1,?,dxp

????定义2.5 若p个随机变量X1,X2,缘分布的乘积,则称X1,X2,,Xp的联合分布等于各自的边

,Xp是相互独立的。

定义2.6 设X?(X1,X2,,Xp)?,若E(Xi)(i?1,,p)存在且有限,则称E(X)?(E(X1),E(X2),,E(Xp))?为X的均值(向量)或数学期望,有时也把E(X)和E(Xi)分别记为μ和?i,即μ?(?1,?2,,?p)?,容易推得均值(向量)具有以下性质: (1)E(AX)?AE(X) (2)E(AXB)?AE(X)B

(3)E(AX?BY)?AE(X)?BE(Y)

其中,X、Y为随机向量,A、B为大小适合运算的常数矩阵。 定义2.7 设X?(X1,X2,,Xp)?,Y?(Y1,Y2,,Yp)?,称D(X)?E(X?E(X))(X?E(X))?

Cov(X1,Xp)?Cov(X2,Xp)??(2.4)

??Cov(Xp,Xp)??为X的方差或协差阵,有时把D(X)简记为Σ,Cov(Xi,Xj)简记为?Cov(X1,X1)Cov(X1,X2)?Cov(X,X)Cov(X,X)2122??????Cov(Xp,X1)Cov(Xp,X2)?ij,从而有Σ?(?ij)p?p;称随机向量X和Y的协差阵为 Cov(X,Y)?E(X?E(X))(Y?E(Y))? ?Cov(X1,Y1)Cov(X1,Y2)?Cov(X,Y)Cov(X,Y)2122 ??????Cov(Xp,Y1)Cov(Xp,Y2)当X=Y时,即为D(X)。

Cov(X1,Yp)?Cov(X2,Yp)??(2.5)

??Cov(Xp,Yp)??若Cov(X,Y)?0,则称X和Y不相关,由X和Y相

互独立易推得Cov(X,Y)?0,即X和Y不相关;但反过 来,当X和Y不相关时,一般不能推知它们独立。

当A、B为常数矩阵时,由定义可以推出协方差阵有如下性质: (1)对于常数向量a,有D(X?a)?D(X) (2)D(AX)?AD(X)A??AΣA? (3)Cov(AX,BY)?ACov(X,Y)B?

(4)设X为n维随机向量,期望和协方差存在,记μ?E(X),Σ?D(X),A为n?n常数阵,则 E(X?AX)?tr(AΣ)?μ?Aμ

这里我们应该注意到,对于任何的随机向量X?(X1,X2,,Xp)?来

说,其协差阵Σ都是对称阵,同时总是非负定(半正定)的。大多数情况是正定的。

若X?(X1,X2,,Xp)?的协差阵存在,且每个分量的方差大于零,则称随机向量X的相关阵为R?Corr(X)?(?ij)p?p,其中

?ij?Cov(Xi,Xj)D(Xi)D(Xj)??ij?ii?jj i,j?1,?,p (2.6)

为Xi与Xj的相关系数。 在数据处理时,为了克服由于指标的量纲不同对统计分析结果带来的影响,往往在使用各种统计分析之前,常需要将每个指标“标准化”,即进行如下变换X*j?Xj?E(Xj)D(Xj),

j?1,,p (2.7)

*?那么由(2.7)构成的随机向量X*?(X1*,X2,,X*p)。令,

C?diag(?11,?22,,?pp),有: X*?C?1(X?E(X))

那么,标准化后的随机向量X*均值和协差阵分别为

E(X*)?E[C?1(X?E(X))]?C?1E[(X?E(X))]?0

D(X*)?D[C?1(X?E(X))]?C?1D[(X?E(X))]C?1?CD(X)C?CΣC?R?1?1?1?1即标准化数据的协差阵正好是原指标的相关阵。 定理2.1 设X~NP(μ,Σ),则有E(X)?μ,D(X)?Σ

多元正态分布的性质

1.若X?(X1,X2,,Xp)?~Np(μ,Σ),Σ是对角阵,则X1,,Xp相互独立。

2.若X~Np(μ,Σ),A为s?p阶常数阵,d为s维常数向量,则 AX?d~Ns(Aμ?d,AΣA?)

即正态随机向量的线性函数还是正态的。 3.若X~Np(μ,Σ),将X,μ,Σ作如下剖分

?X(1)?X??(2)? ?X?p?qq

qp?q?μ(1)?μ??(2)? ?μ?p?qq

?ΣΣ??11?Σ21Σ12?Σ22??p?qq

则X(1)~Nq(μ(1),Σ11),X(2)~Np-q(μ(2),Σ22)。

这里需要指出的是:第一,多元正态分布的任何边缘分布为正态分布,但反之不真。第二,由于Σ12?Cov(X(1),X(2)),故Σ12?0表示X(1)和X(2)不相关,因此可知,对于多元正态变量而言,X(1)和X(2)的不相关与独立是等价的。

一、填空题:

1.多元统计分析是运用 方法来研究解决 问题的理论和方法。

2. 回归参数显著性检验是检验 对 的影响是否显著。

3.聚类分析就是分析如何对样品(或变量)进行量化分类的问

题。通常聚类分析分为 聚类和 聚类。

4.相应分析的主要目的是寻求列联表 和

的基本分析特征和它们的最优联立表示。

5.因子分析把每个原始变量分解为两部分因素:一部分为 ,另一部分为 。

6.若x(?)NP(?,?),?=1,2,3….n

且相互独立,则样本均值向量x服

从的分布为_____________。

二、名词解释

1. 随机向量 2.相似数据 3.马氏距离(总体内两点间) 三、简答

1. 简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。

2. 简述相应分析的基本思想。

3. 简述求度量MDS古典解的一般步骤。 4. 简述费希尔判别法的基本思想。 5. 简述多元统计分析中协差阵检验的步骤

6. 在进行系统聚类分析时,不同的类间距离计算方法有何区

别?请举例说明。

7. 比较主成分分析与因子分析的异同点。 8. 简述相应分析的基本思想。

9. 进行相应分析时在对因素A和因素B进行相应分析之前没有必要进行独立性检验?为什么? 四、计算:

1.给出标准化变量X1,X2, X3的协差阵(即相关阵)R,同时给出R的特征值和相应的正交化特征向量。要求:1)计算因子载

荷矩阵A,并建立因子模型;

2)计算公因子的方差贡献,并说明

其统计意义。

2.下表是进行因子分析的结果,试根据下列信息计算变量共同度hi2及公共因子Fj 的方差贡献,并说明其统计意义. Component Matrix

Component

1

2 3

X1

.969 -1.084E-02 .205

X2

.911

.321 -.102

X3

.847

-.120 .323

X4

.941

.281 -2.693E-02

X5

.899

.215 -1.963E-02

.839 .305

X6 -.313

X7

-.666 6.280E-02 .679

X8

.575

-.580 .367

Extraction Method: Principal Component Analysis. a 3 components

extracted.

3.会用最短距离法和最长距离法进行聚类分析,并画谱系图。 4.根据给定信息,会进行判别分析。

5.给出资料阵,会求均向量,协差阵、相关阵。 6. 会求矩阵的逆阵,特征根与特征向量。 7. 给出总体资料的协差阵,会求主成分。 8. 给出两组资料的相关阵,会计算典型相关系数。

本文来源:https://www.bwwdw.com/article/uxdo.html

Top