主成分分析法与层次分析法排序公式的研究

更新时间:2023-05-23 18:40:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

 西安理工大学学报JournalofXi’anUniversityofTechnology(2005)Vol.21No.4   文章编号:100624710(2005)0420437204

437

主成分分析法与层次分析法排序公式的研究

王秋萍1,张道宏1,李 萍2

(1.西安理工大学理学院,管理学院,陕西西安710048;2.西安财经学院,陕西西安710061)

摘要:介绍了代数学中的一个重要定理(Perron2Frobenius定理),论述了第一主成分作为系统

评估指数的原理和条件;对两类系统排序评估方法,即主成分分析法(PCA)与层次分析法(AHP)的排序公式进行了分析、比较,指出了PCA与AHP内在的、本质的联系及其适用情况,为正确选择使用PCA与AHP评价方法提供了指导。

关键词:Perron2Frobenius定理;第一主成分;;PCA中图分类号:O212,C931.1   文献标识码:AStudyofRofAnalysisandAHP

21,ZHANGDao2hong1,LIPing2

(1.Facultyof,FacultyofBusinessAdministration,Xi’anUniversityofTechnology,Xi’an710048,China;

2.Xi’anInstituteofFinance&Economics,Xi’an710061,China)

Abstract:ThispaperintroducesanimportantPerron2Frobeniustheoreminalgebra,anddiscus2sesthefirstprincipalcomponentservedastheprincipleandconditionofthesystemevaluationindex.Also,thispaperanalysesandcomparestheevaluationmethodoftherankingformulasoftwotypesofthissystem,i.e.PCAandAHPrankingformulas,andpointsouttheintrinsicandessentialconnectionandapplicablesituationswherebyprovidingtheguidanceforcorrectselec2tionofusingPCA&AHPevaluationmethod.

Keywords:Perron2Frobeniustheorem;thefirstprincipalcomponent;systemevaluatingindex;

notesonPCAandAHP

层次分析法[1](AnalyticHierarchyProcess,简称AHP)是美国著名运筹学家匹兹堡大学教授TLSaaty于20世纪70年代中期提出的,它是对多指标系统进行排序评估的常用方法之一。随着多元统计方

法的普及与应用,主成分分析法(PrincipalComponentAnalysis,简称PCA)也成为构造系统排序评估指数的常用方法之一[2]。文[3]中有用第一主成分作为系统评估指数对系统进行评估的成功案例。本文介绍了Perron2Frobenius定理———AHP中特征根法排序和第一主成分作为系统评估指数的理论基础,以及标准化变量的样本主成分的性质;讨论了第一主成分作为系统评估指数的原理和条件;最后研究了PCA和AHP的排序公式及其内在的、本质的联系,并指出了PCA与AHP的适用情况,对正确选择使用PCA与AHP评价方法具有参考意义。

1 Perron2Frobenius定理

[1]

定理1:设A为非负不可约阵,则:①A有最大的正特征根λ这里λmax。max是单根,其余特征根的模小λ于等于λmax。②max对应的A的特征向量可以由正分量组成,除差一个常数倍数外它是唯一的。

λmin=minmaxmax=max++

x∈Rn

xi>0

xi

x∈Rnxi>0

xi

收稿日期:2005207222

基金项目:西安科技创新环境建设计划项目(HJ0500421)。

作者简介:王秋萍(19642),女,河南新安人,副教授,博士生,研究方向为决策与预测理论、方法及应用。

E2mail:wqp566@。

438 西安理工大学学报(2005)第21卷第4期 

+T

Rn={x=(x1,x2,…,xn)|xi≥0,x≠0}

其中

2 主成分分析及在系统评估中的应用

2.1 标准化变量的样本主成分的性质[2]

λ设p维随机向量X=(X1,X2,…,Xp)T的观测数据阵为Xn×p。Xn×p的相关阵R的特征值λ1≥2≥…λ≥0,相应的标准正交的特征向量为a1,a2,…,ap,用Y1,Y2,,…,Yp表示样本主成分。其中Yk=aTp≥kX

(k=1,2,…,p),记A=(a1,a2,…,ap),Y=(Y1,Y2,…,Yp),则Y=ATX。

λλ性质1 Y的协方差阵D(Y)=Λ=diag(λ1,2,…,p)。

p

性质2

i=1

λ∑

i

=p

性质3 主成分Yk与标准化变量Xi的相关系数ρ(Yk,Xi)为ρ(Yk,Xi)=其中ak=(a1k,a2k,kaik…,apk)T是R对应于λk的单位正交特征向量,(k,i=1,2,…,p)p

p

性质4性质5

k=1p

ρ(Yk,Xi)=∑

2k=1p

2

λ(i,2,,)kaik∑

ik)i=1

(k=1,2,…,p)kk2.2 ,如对某类企业的经济效益进行评估比较,影响企业经济效益的指标有很多,如何更科学、更客观地将一个多指标问题综合为单个指数的形式。主成分分析方

法为样品排序或多指标系统评估提供可行的方法。如果只选一个综合变量来代表原有的原始变量Xj

p

(j=1,2,…,p),最佳的选择便是第一主成分Y1。一方面由主成分的性质5有

i=1

ρ(Y∑

2

1

,Xi)=λ1,知Y1

与原始标准化变量X1,X2,…,Xp的综合相关程度最强;另一方面,由Var(Y1)=λ1知第一主成分Y1对应于数据变异最大的方向。这说明Y1是使数据信息损失最小、精度最高的一维综合变量,因此Y1有可能成为构造系统排序评估指数。然而Y1能否真正成为一个尺度因子,还要看Y1与原变量Xj

(j=1,2,

…,p)的相关情况。如果Y1与所有Xj均正相关,Y1可以成为系统评估排序指数。检验Y1是否与Xj正相关,依据主成分的性质3知ρ(Y1,Xi)=1ai1(i=1,2,…,p)。这里ai1是特征值λ1的特征向量a1的第i个分量,所以检验Y1是否与Xj正相关等价于检验ai1>0,即第一主成分的系数均为正值。

根据代数学中的Perron2Frobenius定理可知下述结论成立。

定理 若协方差矩阵的所有元素均为非负数,则第一主成分的系数均为正数。

假定第一主成分中各变量的系数均为正数,则由正交性一定可以推出其它主成分的系数是有正、负的,于是第一主成分便可解释为尺度因子,而其它被选中的主成分可以解释为不同的形状因子。

3 主成分分析与AHP的注记

(1)主成分分析法和AHP都有坚实的数学基础,由两两比较测度(即判断矩阵)导出排序测度(即排

序权值)常采用特征根法。这与用第一主成分被作为排序评估指数有相同的数学基础———Perron2Frobe2nius定理。

(2)对p个指标n个待评估的样本点v1,v2,…,vn的系统进行排序,如果已知观测数据阵Xn×p,则:①将数据阵标准化(标准化后的数据阵仍记为Xn×p),计算标准化后数据阵Xn×p的协方差阵,这时样本协

T

方差阵就是样本相关阵R;②求R的最大特征值λ;③若l>0,max和相应的特征向量l=(l1,l2,…,lp)令:

T

Y1=Xn×pl=(xij)n×pl=(Y1(1),Y1(2),…,Y1(n))

(1)

由式(1)知:

p

Y1(i)=

j=1

∑x

ij

lj   (i=1,2,…,n)(2)

 王秋萍等:主成分分析法与层次分析法排序公式的研究 439

然后按Y1(1),Y1(2),…,Y1(n)的大小进行评估。这实际上是用第一主成分作为系统评估指数对系统进行评估。用第一主成分作为系统评估指数对系统进行评估的精度为第一主成分的贡献率λ1/p。

由于社会经济系统许多问题的属性常有相对的性质,因此不可能对这类属性的测度确定一种绝对的标度。例如国家的安全就无法用绝对的标度去衡量,对它的估计只能在比较中确定。这提示我们可以在社会经济系统某些问题的测度上考虑一种相对标度。AHP提供了测度决策因素(尤其是社会经济因素)的基本方式。这种方式充分利用人的经验和判断,采用相对标度形式,能够统一有形与无形、可定量与不可定量的因素进行测度。

对p个指标n个待评估的样本点v1,v2,…,vn的系统进行排序或评估,如果对于指标n个待评估的样本点不能用绝对的标度去衡量,便要采取相对标度,那末AHP法是最好的选择之一。一般地,如果一个系统可以分解为如图1的三个层次:最高层次(目标层)为b,第二层次(准则层)为{x1,x2,…,xp},第三层次(方案层)为{y1,y2,…,yn}。设已得到x对b的排序权值向量为:

T

Wb(x)=(Wb(x1),Wb(x2),…,Wb(xp))

y对xi的权向量写成矩阵:

Wx1(y1)

By=

Wx12Wx2(y1)Wx2yxp(y1p(y2)ω……Wxp(yn)

图1 层次结构图

Fig.1 Hierarchystructure

Wx1(yn)

Wx2(yn)

由此可以得到合成排序(层次总排序)为:

T

Wb(y)=ByWb(x)=(Wb(y1),Wb(y2),…,Wb(yn))

(3)

其中Wb(y)=(Wb(y1),Wb(y2),…,Wb(yn))T是y对b的权向量。由式(3)知Wb(y)的分量为:

p

Wb(yi)=

j=1

W∑

xj

(yi)Wb(xj)   (i=1,2,…,n)(4)

按Wb(y1),Wb(y2),…,Wb(yn)的大小进行排序。

下面分析采用第一主成分排序与采用AHP排序的结果。将式(2)与式(4)相比较,可知主成分分析

与层次分析的实质是相同的。在系统综合时,主成分分析的排序向量的第i个分量是第i个样本点(或对象)的p个指标观测值xij(j=1,2,…,p)的加权平均,权系数lj(j=1,2,…,p)是第一主成分的系数,这实际上是第i个样本点(或对象)的p个指标在绝对标度下取值的加权平均。而AHP的总排序向量的第i个分量是第i个样本点(或对象)的p个指标在相对标度下取值的加权平均,权系数Wb(xj)(j=1,2,…,p)是指标层x对最高层b的排序权值向量的分量。

由讨论可知,要对一个系统中的样本排序或进行评估,如果在绝对标度下可以得到样本的p个指标的观测值,且系统中的指标正相关,就可采用主成分分析法;如果对系统中样本的属性(或指标)不可能确定一种绝对的标度,如前面提到国家的安全就无法用绝对的标度去衡量,对它的估计只能在比较中确定,采取相对标度,该系统评估时可采用AHP法。使用AHP法需进行一致性检验。

(3)心理学家GAMiller的实验表明,在某种属性上对若干不同物体进行辨别时,普通人能正确辨别

的物体数目在5~9个之间。Miller认为,心理学上的极限应为9[4]。当元素或方案的个数超过9的情况下,利用AHP时应将元素或方案分组,每组的方案不超过9个。当第一次分组之后,编组的个数超过9,再进行上层编组,使得从目标开始向下形成一个递阶树状层次结构。理论上已证明,在方案个数超过9的情况下,采取分组方式以形成递阶层次结构要比不分组的作法更有效。利用主成分分析时指标或方案的个数可以超过9。

(4)层次分析法是解决指标之间的对比量化问题,并不解决指标的选择问题。指标的选取凭借于人的定性判断,而主成分的一个重要用途是用来选取指标,主成分评价所选取的主成分是原来指标的综合,包含了原来指标的大部分信息。这从AHP与PCA两种评价方法本身便可知这一点。

440 西安理工大学学报(2005)第21卷第4期 

4 应用实例

例 表1是我国16个地区农民在1982年支出情况的抽样调查数据[2],该资料反映了每人平均生活

消费支出情况的六个指标。试根据调查资料利用主成分得分对16个地区的生活水平进行排序。

表1 16个地区农民生活水平的调查数据

Tab.1 Investigationdataofpeasantlivingstandardofsixteenareas

地 区北 京天 津河 北山 西内蒙古辽 宁吉 林黑龙江上 海江 苏浙 江安 徽福 建江 西山 东河 南

食品X1

190.33

135.2095.21104.78128.41145.68159.37116.22221.11144.98169..54115.84101.18

(单位:元)  

衣着X2

43.7736.4022.8325.1127.6332.8333.3829.5738.6429...0921.2621.5030.2623.26

燃料X3

9.7310.479.306.408.9417.7918.3713.2412.53.67.15.16.9617.6412.208.46

住房X4

60.5444.1622.449.8912.5827.2911.13.76..23.5419.5219.1933.6120.20

生活用品及其它X5

49.0136.4922.8118.1723.9939.0925.21.27.3034.3518.1821.7515.9733.7720.50

文化生活服务X6

9.043.942.803.253.273.475.226.045.895.745.006.396.734.943.854.30

调用SPSS11.5的FactorAnalysis菜单进行PCA分析,以59.412%的精度得到了评价的综合指数(第一主成分Y1):

(0.907X1+0.871X2+0.083X3+0.881X4+0.914X5+0.605X6)Y1=

.565

按第一主成分得分由大到小对16个地区农民的生活水平排序为:上海(205.072),北京(166.928),浙江(137.517),天津(121.718),辽宁(118.836),江苏(118.530),吉林(112.195),安徽(106.726),山东(103.412),福建(101.968),江西(96.479),内蒙(93.36),黑龙江(88.942),河南(83.616),河北(79.091),山西(76.654)。

5 结 语

主成分分析法(PCA)与层次分析法(AHP)是对多指标系统进行排序评估的两种常用方法。PCA与AHP既有联系又有区别,本文通过对PCA与AHP排序公式的研究得出:对一个系统中的样本排序或进行评估,如果在绝对标度下可以得到样本的p个指标的观测值,且系统中的指标正相关,这时采用主成分分析法;如果对系统中样本的属性(或指标)不可能确定一种绝对的标度,对它们的估计只能在比较中确定,采取相对标度,此时系统评估可采用AHP法。参考文献:

[1]SaatyTL.Theanalytichierarchyprocess[M].McGraw2HillInternationalBookCompany,1980.

[2]高惠旋(GaoHui2xuan).应用多元统计分析(Appliedmultivariatestatisticalanalysis)[M].北京:北京大学出版社(Bei2jing:BeijingUniversityPress),2005.

[3]KendallM.Multivariateanalysis[M].CharlesGriffin&CompanyLimited,1975.

[4]MillerGA.Themagicalnumbersevenplusorminustwo:Somelimitsonourcapacityforprocessinginformation[J].PsychologicalReview,1956,63:81297.

[5]SaatyTL,HuG.Rankingbyeigenvectorversusothermethodsintheanalytichierarchyprocess[J].ApplMathLett,1998,11(4):1212125.

[6]王秋萍(WangQiu2ping).模糊综合评判与AHP的联系(TheconnectionoffuzzysyntheticassessmentwithAHP)[J].西安理工大学学报(JournalofXi’anUniversityofTechnology),1997,13(4):3852388.

(责任编辑 陈洁)

本文来源:https://www.bwwdw.com/article/70f4.html

Top