因子分析主成份分析案例详解

更新时间:2023-09-16 11:56:01 阅读量: 高中教育 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

评价指标的建立

针对我国各省市综合发展情况做因子分析。数据表中选取了六个指标分别是:人均GDP(元)X1,新增固定资产(亿元)X2,城镇居民人均年可支配收入(元)X3,农村居民机家庭纯收入(元)X4,高等学校数量(所)X5,卫生机构数量(所)X6。。见下表:

各项指标及评价的内容 人均GDP 经济实力 新增固定资产 发展潜力能力 城镇居民人均年可支配城镇居民生活水平 收入 农村居民机家庭纯收入 农村居民生活水平 高等学校数量 教育水平 卫生机构数量 医疗水平 考察数据是否适合做因子分析

运用因子分析方法的前提是,变量之间存在线性的关系,这样才能够达到减

少变量,方便分析的目的。通过变量的相关矩阵可知,大多数变量的相关系数大于0.3,具有较强的相关性,同时,对上述变量进行了KMO测试度和Baetlett球体检验,见下表: Correlation Matrix 人均GDP 新增固定城镇居民人均年农村居民机家高等学校卫生机构资产 .459 1.000 .259 可支配收入 .760 .259 1.000 庭纯收入 .935 .449 .845 数量 .286 .658 .258 数量 -.061 .570 .134 Correlation 人均GDP 新增固定资产 城镇居民人均年可支配收入 农村居民机家庭纯收入 高等学校数量 卫生机构数量 Sig. (1-tailed) 人均GDP 新增固定资产 城镇居民人均年可支配收入 农村居民机家庭纯收入 1.000 .459 .760 .935 .449 .845 1.000 .390 .093 .286 -.061 .658 .570 .006 .258 .134 .000 .087 .390 .093 .000 .007 .000 1.000 .748 .066 .000 .088 .748 1.000 .377 .001 .244 .006 .000 .087 .000 .000 .007 .018 .315 1

高等学校数量 卫生机构数量 .066 .377 .000 .001 .088 .244 .018 .315 .000 .000 KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy. Bartlett's Test of Sphericity Approx. Chi-Square df Sig. .635 148.798 15 .000 分析可知,巴特利特球度检验统计量观测值为148.798,相应的概率P接近0。如果显著性水平为0.05,由于概率P小于显著性水平0.05,应拒绝零假设,认为相关矩阵与单位矩阵有显著差异。同时,KMO值为0.635,较好的达到了标准,可以运用因子分析的方法。

提取因子

根据原来变量的相关系数矩阵,采用主成分分析法提取因子并选取大于1的特征根。 Communalities 人均GDP 新增固定资产 城镇居民人均年可支配收入 农村居民机家庭纯收入 高等学校数量 卫生机构数量 Initial 1.000 1.000 1.000 1.000 1.000 1.000 Extraction .930 .721 .795 .961 .847 .859 Extraction Method: Principal Component Analysis. 表中第2列是根据因子分析初始解计算出来的变量共同度,第三列是根据因子分析最终解计算出的变量共同度。可以看出,变量的绝大部分信息可被因子分析,信息丢失较少。因子提取的总体效果比较好。 Total Variance Explained Extraction Sums of Squared Initial Eigenvalues % of Component 1 Total Variance Cumulative % Total 55.449 3.327 Loadings % of Variance 55.449 Cumulative % Total 55.449 2.796 Rotation Sums of Squared Loadings % of Variance 46.605 Cumulative % 46.605 3.327 55.449 2

2 1.786 29.771 85.220 1.786 29.771 85.220 2.317 38.614 85.220 3 4 5 6 .497 .262 .088 .040 8.285 4.362 1.473 .660 93.505 97.867 99.340 100.000 Extraction Method: Principal Component Analysis. 看图表的第二列,变量相关系数矩阵有2大特征根大于1,它们分别是:3.327,1.786. 它们一起解释了各省市综合发展情况的85.22%。也就是说前2个因子集中体现了原始数据大部分的信息,因此,提取2个公共因子是合适的,能够比较全面的反映情况。同时可以参考碎石图来验证。 该图的横坐标为因子数目,纵坐标为特征根。曲线迅速下降,然后下降变得平缓,从第3个因子开始变成近似一条直线,特征跟值小于1,解释原有的变量贡献小。曲线变平开始的前一个点被认为是提取的最大因子数,即提取2个公因子。第3个因子后面的这些散点像山脚下的碎石,可以舍去,不会损失太多信息。

因子的命名与解释

计算输出因子载荷矩阵(component martix),是用标准化的公因子近似表示标准化原始变量的系数矩阵,见下表: Component Matrix 3

a 农村居民机家庭纯收入 人均GDP 城镇居民人均年可支配收入 新增固定资产 高等学校数量 卫生机构数量 Component 1 .893 .831 .781 .732 .694 .461 2 -.405 -.490 -.431 .430 .605 .804 Extraction Method: Principal Component Analysis. a. 2 components extracted. 农村居民机家庭纯收入=0.893F1-0.405F2 人均GDP=0.831F1-0.490F2

城镇居民人均年可支配收入=0.781F1-0.431F2 新增固定资产=0.732F1-0.430F2 高等学校数量=0.694F1-0.605F2 卫生机构数量=0.461F1-0.804F2 Rotated Component Matrix a 农村居民机家庭纯收入 人均GDP 城镇居民人均年可支配收入 卫生机构数量 高等学校数量 新增固定资产 Component 1 .961 .960 .885 -.098 .207 .340 2 .196 .091 .109 .922 .897 .778 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. a. Rotation converged in 3 iterations. 根据因子正交旋转矩阵,将指标分成4个公共因子并命名:第一个公因子F1在农村居民机家庭纯收入、人均GDP、城镇居民人均年可支配收入有较大的载荷,这三个指标是对城市整体经济发展情况的描述,因此,可称为经济因子;第二个因子F2在新增固定资产、高等学校数量、卫生机构数量有较大的载荷,这三个指标反映对社会建设情况的描述,因此可称为社会因子。

公共因子命名 变量 载荷 指标

F1 农村居民机家庭纯收入 人均GDP 4

F2 新增固定资产 高等学校数量 城镇居民人均年可支配收入 因子 命名 经济因子 旋转后的因子载荷图

卫生机构数量 社会因子 计算因子得分与综合评价得分及排序

Component Score Coefficient Matrix 人均GDP 新增固定资产 城镇居民人均年可支配收入 农村居民机家庭纯收入 高等学校数量 卫生机构数量 Component 1 .363 .037 .332 .350 -.030 -.152 2 -.075 .324 -.058 -.026 .396 .446 5

Component Score Coefficient Matrix 人均GDP 新增固定资产 城镇居民人均年可支配收入 农村居民机家庭纯收入 高等学校数量 卫生机构数量 Component 1 .363 .037 .332 .350 -.030 -.152 2 -.075 .324 -.058 -.026 .396 .446 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. Component Scores. F1=0.363XI+0.037X2+0.332X3+0.35X4-0.03X5-0.152X6 F2=-0.075XI+0.324X2-0.058X3-0.026X4+0.3965+0.446X6

其中,X1、X2、X3……、X6为各项指标经处理之后的标准化数据。

城镇居农村居民机家庭纯收入 地区 人均GDP 新增固定资产 民人均年可支配收入 上 海 15204 北 京 10265 天 津 8164 广 东 6380 浙 江 6149 海 南 4802 福 建 5386 辽 宁 6103 江 苏 5785 新 疆 3935 吉 林 3703 青 海 2910 宁 夏 2685 广 西 2772

128.93 30.81 49.13 51.82 41.88 5.35 18.35 124.02 101.09 26.65 28.65 4.16 7.94 32.52 7191 4245 6235 4929 7438 6221 4770 4506 3223 2406 2699 2966 1519 2048 高等卫生经济因子按经社会因子最按社学校机构最终得分 济因终得分 会因数量 数量 子排子排序 序 1 25 45 5286 8592.162 749.4013 65 21 42 37 5 30 4955 3182 8848 8721 1653 4537 6170.295 4959.584 4385.767 4010.407 3607.208 3478.065 2 3 4 5 6 7 8 9 10 11 12 13 14 1030.349 482.6681 2999.552 3018.678 64.6474 1322.781 2342.683 4662.176 1204.508 1258.046 91.10984 40.35356 1982.52 24 26 9 8 28 21 14 3706 1756 4634 2456 4163 3174 3319 3382 4791 1136 1609 1029 998 1446 61 6719 3041.852 67 21 43 7 7 27 12039 3932 3891 1176 1028 5571 6

2669.845 2610.813 2369.445 2339.58 2290.607 2256.549 2 23 22 27 29 17 黑龙江 4427 48.51 102.54 54.51 26.28 37.75 22.07 43.01 33.97 48.48 55.74 3375 1766 4264 1715 2863 1208 3376 4208 3931 4699 3305 4085 3795 1537 1511 1086 1425 1206 1010 1302 38 7637 2185.432 48 10462051.575 3 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 2863.176 4091.352 1793.838 2025.479 3846.306 1397.718 3595.482 2228.043 2428.234 2529.361 4098.456 1503.895 2405.896 3050.754 8023.364 10 山 东 4473 内蒙3013 古 江 西 2376 湖 北 3341 贵 州 1553 湖 南 2701 山 西 2819 云 南 2490 安 徽 2521 4 18 16 5 20 6 15 12 11 3 19 13 7 1 19 4915 1721.402 31 56 22 47 26 26 35 47 17 46 50 64 5423 9744 3934 9137 5922 6395 6593 10266 4131 6215 7661 18885 1697.016 1657.318 1651.12 1650.638 1642.99 1642.564 1629.639 1552.095 1425.366 1341.073 1261.211 -222.172 河 北 3376 77.76 甘 肃 1925 14.84 陕 西 2344 26.31 河 南 2475 71.36 四 川 2516 80.97 3921 1668 3152 880 3309 962 3299 1231 4002 1158

因子综合评价得分

每个地区的因子得分计算方法是:用每个共因子的方差贡献率做权数,对每个因子进行加权,然后加总得到每个地区的总因子得分。按总得分的多少进行排序,以反映各地区经济发展的差异 地区 上 海 北 京 广 东 江 苏 浙 江 辽 宁 天 津 山 东 四 川 河 北 福 建 湖 北 湖 南 黑龙江 河 南 广 西

F1经济因子 F2P社会因子 3.4426 0.31939 1.9691 -0.01153 1.48572 0.20939 0.39444 1.79597 1.23631 0.04241 0.11773 1.29606 1.14186 -0.89127 -0.10564 1.26892 -1.07337 2.52658 -0.37845 1.02985 0.40873 -0.71704 -0.4098 0.77333 -0.34448 0.54396 -0.26411 0.22116 -0.76543 0.78671 -0.13034 -0.44719 7

因子综合得分 2.351529 1.277181 1.039843 0.884055 0.81923 0.529371 0.431601 0.374553 0.184247 0.11353 0.01545 0.003518 -0.03411 -0.09458 -0.2232 -0.24103 排序 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 安 徽 吉 林 海 南 云 南 新 疆 江 西 陕 西 山 西 内蒙古 贵 州 甘 肃 青 海 宁 夏 权数 因子方差贡献率 -0.53624 -0.35673 0.32126 -0.57328 -0.22699 -0.5448 -0.88189 -0.66019 -0.68292 -0.62098 -0.89253 -0.52773 -0.54184 0.650657 55.449 0.14132 -0.28068 -1.73471 -0.15859 -0.82736 -0.35921 0.09715 -0.33339 -0.39781 -0.77376 -0.89662 -1.6227 -1.60033 0.349343 29.771 -0.29954 -0.33016 -0.39698 -0.42841 -0.43672 -0.47997 -0.53987 -0.54602 -0.58332 -0.67435 -0.89396 -0.91025 -0.91162 17 18 19 20 21 22 23 24 25 26 27 28 29 8

本文来源:https://www.bwwdw.com/article/5cxh.html

Top