主成分分析在综合评价中的应用 - 图文

更新时间:2023-03-16 22:45:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

四川农业大学商学院课程论文

《数据处理方法》

课程论文

论文题目: 主成分分析在综合评价中的应用 成员1: 工作: 分数: 成员2: 工作: 分数: 成员3: 工作: 分数: 成员4: 工作: 分数:

2013-5-14

主成分分析在综合评价中的应用

摘要 本文根据2007年各地区国有及国有控股工业企业主要经济效益指标的统计数据,进行主成分分析并选取三个主成分,运用主成分对各地区进行综合排名。运用K均值聚类,得出的结果与主成分综合排名进行比较,结果相当吻合,主成分分析可广泛运用于经济指标数据分析。

关键字:主成分分析 经济效益指标 综合排名 分类

Application of Principal Component Analysis in the analysis of Economic Data

Xionghao, Information and Computing Science, 20109271 Yang Xiaotao, Information and Computing Science, 20109281

Zou Huimin, Financial Management, 20118795 Zhao Wenqin, Financial Management, 20118793

Abstract: according to the 2007 state-owned and state holding industrial enterprises in various areas of the main economic benefit index statistics, principal component analysis and three principal components and using the principal component comprehensive ranking for all regions. Using k-means clustering, and the results comparing with principal component comprehensive ranking and the results are consistent, principal component analysis data analysis can be widely used in economic indicators.

Key words: principal component analysis ;Comprehensive ranking ;Classification

1.问题描述

经济数据分析结果对国家的宏观调控与企业决策有着至关重要的作用。本文基于2007年各地区国有及国有控股工业企业主要经济效益指标数据,研究以下问题:

(1)根据指标的属性将原始数据统一趋势化;

(2)利用协方差或相关系数矩阵进行主成分分析,并试讨论可否只用第一主成分排名;

(3)对各地区进行综合排名; (4)将分析结果与聚类结果进行比较。

2.问题分析

针对问题(1),首先我们将所选取的数据进行数据属性分类,数据的评价指标通常分为效益型、成本型,适度型等;然后再将属性分类后的数据按照特定的变换公式进行统一趋势化处理,消除量纲。

针对问题(2),我们选取原始数据的相关系数矩阵进行主成分分析,得出若干主成分;可否只使用第一主成分排名则要依据第一处成分的贡献率决定,即第一主成分的贡献率达到80%及以上,可认为能只用第一主成分进行排名。

针对问题(3),其实就是主成分在综合排名中的应用。需要根据第(2)问中主成分的贡献率选取合适的主成分,在进行排名。

针对问题(4),选取K均值聚类方法,将各地区分类;再与主成分分析结果进行比对,得出结论。

3.模型建立与求解

3.1 统一趋势化模型

3.1.1 数据属性变换

在解决经济问题综合评价时,评价指标通常分为效益型、成本型,适度型等

类型,效益型指标值越大越好,成本型指标值越小越好,适度型指标既不太大也不太小为好。根据此标准,我们用I1、I2 分别表示效益型和成本型指标集合,将2007年各地区国有及国有控股工业企业主要经济效益指标数据(以下简称样本数据)评价指标作以下分类:

效益型(I1):工业增加值率,总资产贡献率,产品销售率,流动资产周转次数,工业成本费用利润率;

成本型(I2):资产负债率;

数据矩阵X的每一列为评价指标,共有6项指标;每一行为一个地区关于6项评价指标的指标值,共有31个地区。这样表示第i个地区关于第j项评价指标的指标值为xij(i=1,2,…,31;j=1,2,…,6)。 3.1.2 统一趋势化与无量纲化

我们将I1、I2运用极差变换法建立无量纲的优属度效益型矩阵B,其变换公式为:

其中,n=(1,2,3,…,31),p=(1,2,3,4,5,6)。

我们运用Matlab编程计算得出矩阵B,指标经过极差变化后均有0?bij?1,且各指标下组好的结果的属性值bij=1,最坏结果bij=0,指标变换前后的属性值成比例。至此,样本数据统一趋势化完成。

3.2 主成分分析

此前我们已经运用Matlab软件得出样本数据X统一趋势化后的属性一致的指标矩阵B,接下来我们需要求得矩阵B的相关系数矩阵R,由于公式定理较多,本文就不再一一给出,本文后会附带本文相关的Matlab程序代码。

运用Matlab计算R的特征值d与相应的特征向量矩阵V,特征向量矩阵V就是主成分的系数向量。他们分别为图(一),图(二)所示:

图(一) 相关系数矩阵R的特征值d

图(二) 相关系数矩阵R的特征向量矩阵V

根据特征值计算主成分贡献率W,如图(三):

图(三)各主成分的贡献率W

第一、二、三主成分的累计贡献率为:

0.4332+0.3463+0.1139=0.8934

已达89.34%,大于85%,所以取前三个主成分,即y1,y2,y3;

而第一主成分的贡献率只有43.32%,远小于85%,所以为了确保分析的准确性,不能只选用第一主成分对各地区进行排名。

3.3 综合排名

要对各地区进行综合排名,我们首先要求得各主成分得分,计算公式为:

F=B?V

其中B?是将矩阵B标准化以后的矩阵,在Matlab软件中的调用函数为zscore(B)。各主成分得分如图(四):

本文来源:https://www.bwwdw.com/article/s3uv.html

Top