matlab主成分分析案例

更新时间:2024-06-11 00:08:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

1.设随机向量X=(X1,X2,X3)T的协方差与相关系数矩阵分别为

?14??10.8???,???R??425??0.81??

????分别从?,R出发,求X的各主成分以及各主成分的贡献率并比较差异况。

解答:

>> S=[1 4;4 25];

>> [PC,vary,explained]=pcacov(S); 总体主成分分析:

>> [PC,vary,explained]=pcacov(S) 主成分交换矩阵: PC =

-0.1602 -0.9871 -0.9871 0.1602 主成分方差向量: vary = 25.6491 0.3509

各主成分贡献率向量 explained = 98.6504 1.3496

则由程序输出结果得出,X的主成分为: Y1=-0.1602X1-0.9871X2 Y2=-0.9871X1+0.1602X2

两个主成分的贡献率分别为:98.6504%,1.3496%;则若用第一个主成分代替原来的变量,信息损失率仅为1.3496,是很小的。

2.根据安徽省2007年各地市经济指标数据,见表5.2,求解: (1)利用主成分分析对17个地市的经济发展进行分析,给出排名; (2)此时能否只用第一主成分进行排名?为什么?

工业总资产合工业增实收资长期负业务收业务成地区 产值 计 加值 本 债 入 本 第 1 页 共 6 页

利润 合肥 491.70 380.31 158.39 121.54 22.74 439.65 344.44 17.43 淮北 21.12 30.55 6.40 12.40 3.31 21.17 17.71 2.03 亳州 1.71 2.35 0.57 0.68 0.13 1.48 1.36 -0.03 宿州 9.83 9.05 3.13 3.43 0.64 8.76 7.81 0.54 蚌埠 64.06 77.86 20.63 30.37 5.96 63.57 52.15 4.71 阜阳 30.38 46.90 9.19 9.83 17.87 28.24 21.90 3.80 淮南 31.20 70.07 8.93 18.88 33.05 31.17 26.50 2.84 滁州 79.18 62.09 20.78 24.47 3.51 71.29 59.07 6.78 六安 47.81 40.14 17.50 9.52 4.14 45.70 34.73 4.47 马鞍山 104.69 78.95 29.61 25.96 5.39 98.08 84.81 3.81 巢湖 21.07 17.83 6.21 6.22 1.90 20.24 16.46 1.09 芜湖 214.19 146.78 65.16 41.62 4.39 194.98 171.98 11.05 宣城 31.16 27.56 8.80 9.44 1.47 28.83 25.22 1.05 铜陵 12.79 14.16 3.66 4.07 1.57 11.95 10.24 0.73 池州 6.45 5.37 2.39 2.20 0.40 5.97 4.79 0.52 安庆 39.43 44.60 15.17 15.72 3.27 36.03 27.87 3.48 黄山 5.02 3.62 1.63 1.42 0.53 4.45 4.04 0.02 解答: (1)

>> clear

>> A=[491.70,380.31,158.39,121.54,22.74,439.65,344.44,17.43; 21.12,30.55,6.40,12.40,3.31,21.17,17.71,2.03; 1.71,2.35,0.57,0.68,0.13,1.48,1.36,-0.03; 9.83,9.05,3.13,3.43,0.64,8.76,7.81,0.54;

64.06,77.86,20.63,30.37,5.96,63.57,52.15,4.71; 30.38,46.90,9.19,9.83,17.87,28.24,21.90,3.80; 31.20,70.07,8.93,18.88,33.05,31.17,26.50,2.84; 79.18,62.09,20.78,24.47,3.51,71.29,59.07,6.78; 47.81,40.14,17.50,9.52,4.14,45.70,34.73,4.47; 104.69,78.95,29.61,25.96,5.39,98.08,84.81,3.81; 21.07,17.83,6.21,6.22,1.90,20.24,16.46,1.09;

214.19,146.78,65.16,41.62,4.39,194.98,171.98,11.05; 31.16,27.56,8.80,9.44,1.47,28.83,25.22,1.05; 12.76,14.16,3.66,4.07,1.57,11.95,10.24,0.73; 6.45,5.37,2.39,2.20,0.40,5.97,4.79,0.52;

39.43,44.60,15.17,15.72,3.27,36.03,27.87,3.48; 5.02,3.62,1.63,1.42,0.53,4.45,4.04,0.02]; 得到的相关系数矩阵为: >> R=corrcoef(A) R =

1.0000 0.9877 0.9988 0.9820 0.4281 0.9999 0.9980 0.9510

第 2 页 共 6 页

0.9877 1.0000 0.9884 0.9947 0.5438 0.9885 0.9835 0.9485

0.9988 0.9884 1.0000 0.9824 0.4294 0.9984 0.9948 0.9462

0.9820 0.9947 0.9824 1.0000 0.5051 0.9829 0.9763 0.9391

0.4281 0.5438 0.4294 0.5051 1.0000 0.4311 0.4204 0.4557

0.9999 0.9885 0.9984 0.9829 0.4311 1.0000 0.9986 0.9530

0.9980 0.9835 1.0000 0.9569

0.9510 0.9485 0.9569 1.0000

计算特征值与特征向量: >> [v,d]=eig(corrcoef(A)) v =

-0.3723 0.1179 -0.5641 0.3041

-0.3741 -0.0343 -0.1535 0.5841

-0.3719 0.1152 0.0383 -0.5244

-0.3713 0.0096 0.0303 -0.2845

-0.1949 -0.9689 0.0151 -0.0593

-0.3725 0.1143 0.7946 0.2988

-0.3716 0.1272 -0.1557 -0.3428

-0.3613 0.0596 0.0022 -0.0096 d =

7.1135 0 0 0 0 0 0 0

0 0.7770 0 0 0 0 0 0

0 0 0.0810 0 0 0 0 0

0 0 0 0.0237 0 0 0 0

0 0 0 0 0.0041 0

0.9948 0.9763 0.9462 0.9391 0.1411 -0.2543 0.1606 0.2247 0.1957 -0.1954 0.2368 0.7875 -0.0004 -0.1242 0.1222 -0.2302 0.0353 -0.3800 -0.9185 0.1165 第 3 页 共 6 页

0.4204 0.4557 -0.0459 -0.1514 -0.6909 0.2168 0.0119 0.0924 0.6591 -0.0872 0.9986 0.9530 0.5917 -0.6284 -0.1351 0.2385 0.0628 0.2259 -0.3521 0.0302 0 0

0 0 0 0 0 0.0006 0 0

0 0 0 0 0 0 0.0000 0

0 0 0 0 0 0 0 0.0001

各主成分贡献率:

>> w=sum(d)/sum(sum(d)) w =

0.8892 0.0971 0.0101 0.0030 0.0000 0.0000

计算各个主成分得分:

>> F=[A-ones(17,1)*mean(A)]*v(:,8) F =

224.3503 -24.0409 -40.0941 -35.9075 4.7573 -12.6102 -2.8573 1.8038 -13.9012 13.4541 -29.3847 62.3383 -23.3175 -32.4285 -38.1309 -14.8637 -39.1675

>> [F1,I1]=sort(F,'descend')

F1按从大到小的顺序给个主成分得分排名: F1 =

224.3503

第 4 页 共 6 页

0.0005 0.0001 62.3383 13.4541 4.7573 1.8038 -2.8573 -12.6102 -13.9012 -14.8637 -23.3175 -24.0409 -29.3847 -32.4285 -35.9075 -38.1309 -39.1675 -40.0941

I1给出各个名次的序号:I1 =

1 12 10 5 8 7 6 9 16 13 2 11 14 4 15 17 3

>> [F2,I2]=sort(I1) F2 =

1 2

第 5 页 共 6 页

3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

I2给出个城市排名,即所求排名: I2 =

1 11 17 14 4 7 6 5 8 3 12 2 10 13 15 9

16

(2)由于第一主成分的贡献率大于80%,其他各成分贡献率都太小,所以只能用第一主成分进行排名。

第 6 页 共 6 页

本文来源:https://www.bwwdw.com/article/f6a6.html

Top