系统工程(基于spss的主成分分析和聚类分析)

更新时间:2024-06-25 16:30:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

系统工程论文

主成分分析与聚类分析

姓 名: 学 号: 班 级: 学 院:

指导教师:

数据为2012年全国各省城镇民平均每人全年家庭收入来源的各项数据。数据来源位国家统计局http://data.stats.gov.cn/easyquery.htm?cn=E0103

表1-1 2012年全国各省城镇民平均每人全年家庭收入来源

城镇居城镇居城镇居城镇居城镇居民人均城镇居民人均民人均民人均民人均可支配民人均工资性经营净财产性转移性收入总收入收入收入收入收入 (元) (元) (元) (元) (元) (元) 北京市 36468.8 41103.1 27961.8 1430.2 717.6 10993.5 天津市 29626.4 32944 21523.8 1200.1 515.5 9704.6 河北省 20543.4 21899.4 13154.5 2257.5 338.5 6149 山西省 20411.7 22100.3 14973.6 1041.4 301.8 5783.4 内蒙古 23150.3 24790.8 16872.6 2698.7 564 4655.5 辽宁省 23222.7 25915.7 14846.1 2710.3 493 7866.4 吉林省 20208 21659.6 13535.3 2168.8 324 5631.5 黑龙江省 17759.8 19367.8 11700.5 1729.3 186.1 5752 上海市 40188.3 44754.5 31109.3 2267.2 575.8 10802.2 江苏省 29677 32519.1 20102.1 3421.9 690 8305.2 浙江省 34550.3 37994.8 22385.1 4694.4 1465.3 9450 安徽省 21024.2 23524.6 14812.5 2155.3 549.6 6007.1 福建省 28055.2 30877.9 19976 3337 1795.2 5769.7 江西省 19860.4 21150.2 13348.1 1946.8 527.6 5327.7 山东省 25755.2 28005.6 19856.1 2621.4 704.9 4823.2 河南省 20442.6 21897.2 13666.5 2545.1 333.8 5351.8 湖北省 20839.6 22903.9 14191 2158.3 476.2 6078.3 湖南省 21318.8 22804.6 13237.1 3008.3 867.8 5691.4 广东省 30226.7 34044.4 23632.2 3603.9 1468.7 5339.6 广西 21242.8 23209.4 14693.5 2131.8 883.7 5500.4 海南省 20917.7 22809.9 14672.3 2397.4 717.6 5022.5 重庆市 22968.1 24811 15415.4 2183.5 538.4 6673.6 四川省 20307 22328.3 14249.3 2017.8 633.8 5427.3 贵州省 18700.5 20042.9 12309.2 1982.5 355.7 5395.6 云南省 21074.5 23000.4 14408.3 2425 1000 5167.1 西藏 18028.3 20224.2 17672.1 570.9 417.9 1563.3 陕西省 20733.9 22606 15547.3 882 269.6 5907.1 甘肃省 17156.9 18498.5 12514.9 1125.7 259.6 4598.2 青海省 17566.3 19746.6 12614.4 1191.4 93 5847.8 宁夏 19831.4 21902.2 13965.6 2522.8 160.9 5252.9 新疆 17920.7 20194.6 14432.1 1633.2 145.5 3983.7

- 1 -

一 主成分分析

主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。

其分析步骤如下:

1.1.1 首先将样本数据写成矩阵的形式

Y12?Y11?YY2221Y???????Y310,1Y31,2??Y16??Y26???????Y31,6?? (1)

对样本进行标准化处理 标准化处理计算式位

Xij?131Yij??Yij31i?1131?131?Yij???Yij?31?31i?1?i?1? (2)

经过标准化处理后可得到标准化矩阵

?X11?X21X???????X31,1X12X22?X310,2?X16??X26???????X31,6?? (3)

数据标准化是为了消除量纲的影响。

矩阵元素如表1-2所示,标准化矩阵是通过MATLAB程序实现,源程序在文章最后。

表1-2 标准化数据

2.439061 -0.8772 1.061778 -1.14095 -0.72867 0.071089 -0.33951 -1.32286 0.066746 0.576813 -0.36678 0.590109 - 2 -

2.267143 1.096388 -0.45774 -0.48027 -0.01169 0.000697 2.348484 1.122627 -0.53676 -0.50658 -0.10234 0.066666 0.312863 -0.19304 -0.63611 -0.72798 -0.07163 -0.24936 2.474381 1.819538 0.013069 -0.17268 -0.74572 0.885616

-0.51513 -0.93402 2.903561 1.105046 1.938882 -0.37547 0.827552 -0.5746 0.434015 -0.47499 -0.40706 -0.32507 1.199102 -0.33807 -0.3937 -0.04287 -0.49819 -0.77307 -0.36687 -0.88808 -0.42514 -1.03718 -0.96713 -0.57956 -0.90649

(续)表1-2 标准化数据 -0.57279 -0.6472 -0.03058 -0.67241 -0.91712 -1.03972 -0.53436 -1.0176 2.897085 3.112406 0.082208 -0.04209 1.058788 0.757634 1.405777 0.243774 1.88148 1.246036 2.864373 2.184523 -0.29258 -0.37397 -0.04606 -0.10768 0.812207 0.730657 1.308461 3.010337 -0.64932 -0.68725 -0.28505 -0.16275 0.380661 0.705007 0.488208 0.281072 -0.53709 -0.61914 0.400749 -0.64787 -0.38584 -0.50693 -0.04262 -0.29142 -0.40076 -0.711 0.93169 0.688847 1.287955 1.512829 1.614393 2.193034 -0.33994 -0.39943 -0.07299 0.728648 -0.39996 -0.40396 0.231449 0.312863 -0.09931 -0.24499 -0.01373 -0.13572 -0.47232 -0.49446 -0.20367 0.103092 -0.81569 -0.9095 -0.24413 -0.59305 -0.37134 -0.46044 0.263085 1.019773 -0.78845 0.237783 -1.86217 -0.43735 -0.4306 -0.21678 -1.50557 -0.80858 -1.04773 -0.8655 -1.22623 -0.83361 -0.86021 -0.84421 -1.15092 -1.25065 -0.53634 -0.55515 0.375188 -1.08068 -0.7929 -0.45535 -0.64451 -1.11923 -0.24985 -0.18863 2.377188 1.108555 1.690185 -0.05903 -0.17964 -0.4042 -0.66052 -0.39196 -0.02285 -0.21942 -0.39816 -0.31646 -0.55926 0.279599 -0.3536 -0.36971 -0.4858 -2.31676 -0.10983 -0.77484 -0.13996 -0.44221 -1.08704 1.1.2 计算6个指标的协方差矩阵

?r11?r1T21R?XX????31???r31,1r12r22?r31,2?r16??r26???????r31,6?? (4)

矩阵(4)是一个实对称矩阵。

经计算,矩阵(4)的每一个元素如表格3所示。

- 3 -

表1-3 相关系数矩阵

1 0.998144 0.998144 0.95094 1 1 0.44422 0.550481 0.808298 0.251428 0.471459 0.662525 1 0.704031 0.24619 1 0.201289 1 0.959479 0.422711 0.542934 0.805363 0.95094 0.959479 0.44422 0.422711 0.251428 0.805363 0.550481 0.542934 0.471459 0.704031 0.808298

1.1.3 求相关系数的特征矩阵和特征值,

表1-4 特征向量系数

-1.2E-05 0.85499 -0.7902 0.662525 0.24619 0.201289 -0.12139 0.047951 -0.12667 0.485709 -0.31736 -0.11754 0.078445 -0.14248 0.484348 0.554972 -0.36132 -0.34513 0.437326 -0.22413 0.448163 0.103575 -0.09384 -0.45755 -0.51248 0.658657 0.273208 0.047431 -0.02824 0.629015 0.384637 0.59077

表1-5 特征值

5.21E-11 0 0 0 0 0

表1-6 特征值及主成分贡献率

主成分 1 2 3 4 5

0.323013 0.233681 -0.16769 0.497312 -0.62426 -0.36136 0.386865 0 0.002164 0 0 0 0 0 0 0.180652 0 0 0 0 0 0 0.450666 0 0 0 0 0 0 1.233975 0 0 0 0 0 0 4.132542 特征值 4.132542 1.233975 0.450666 0.180652 0.002164 - 4 -

贡献率 69% 21% 8% 2% 0% 累计贡献率 69% 90% 98% 100% 100%

本文来源:https://www.bwwdw.com/article/9vo3.html

Top