R软件中的主成分分析

更新时间:2023-10-15 16:20:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

问题

表1为某地区农业生态经济系统各区域单元相关指标数据,运用主成分分析方法,用更少的指标信息较为精确地描述该地区农业生态经济的发展状况。

表1 某农业生态经济系统各区域单元的有关数据

x:经济作

x 4:农民人x 5:人均粮 6x:耕地占x 8:果园与x 9:灌溉田

样本x1:人口密度x 2:人均耕x 3:森林覆物占农作物 7

均纯收入(元食产量 (kg/土地面积比林地面积之占耕地面积2

序号 (人/km) 地面积(ha) 盖率(%) 播面比例

/人) 人) 率(%) 比(%) 之比(%)

(%) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

363.912 141.503 100.695 143.739 131.412 68.337 95.416 62.901 86.624 91.394 76.912 51.274 68.831 77.301 76.948 99.265 118.505 141.473 137.761 117.612 122.781

0.352 1.684 1.067 1.336 1.623 2.032 0.801 1.652 0.841 0.812 0.858 1.041 0.836 0.623 1.022 0.654 0.661 0.737 0.598 1.245 0.731

16.101 24.301 65.601 33.205 16.607 76.204 71.106 73.307 68.904 66.502 50.302 64.609 62.804 60.102 68.001 60.702 63.304 54.206 55.901 54.503 49.102

192.11 1 752.35 1 181.54 1 436.12 1 405.09 1 540.29 926.35 1 501.24 897.36 911.24 103.52 968.33 957.14 824.37 1 255.42 1 251.03 1 246.47 814.21 1 124.05 805.67 1 313.11

295.34 452.26 270.12 354.26 586.59 216.39 291.52 225.25 196.37 226.51 217.09 181.38 194.04 188.09 211.55 220.91 242.16 193.46 228.44 175.23 236.29

26.724 32.314 18.266 17.486 40.683 8.128 8.135 18.352 16.861 18.279 19.793 4.005 9.110 19.409 11.102 4.383 10.706 11.419 9.521 18.106 26.724

18.492 14.464 0.162 11.805 14.401 4.065 4.063 2.645 5.176 5.643 4.881 4.066 4.484 5.721 3.133 4.615 6.053 6.442 7.881 5.789 7.162

2.231 1.455 7.474 1.892 0.303 0.011 0.012 0.034 0.055 0.076 0.001 0.015 0.002 5.055 0.010 0.011 0.154 0.012 0.069 0.048 0.092

26.262 27.066 12.489 17.534 22.932 4.861 4.862 3.201 6.167 4.477 6.165 5.402 5.790 8.413 3.425 5.593 8.701 12.945 12.654 8.461 10.078

解答:

1模型选择

x1:人口密度(人/km2) x 2:人均耕地面积(ha)

x 3:森林覆盖率(%) x 4:农民人均纯收入(元/人)

x 5:人均粮食产量 (kg/人) x 6:经济作物占农作物播面比例(%) x 7:耕地占土地面积比率(%) x 8:果园与林地面积之比(%) x 9:灌溉田占耕地面积之比(%)

做主成分分析,命名第一主成分为Z1,第二主成分为Z2,第三主成分为Z3,依次类推,当前m个主成分的累积贡献率达到80%及以上,我们就说脑的大小与前m主成分有关。并求解转化后的Zi与xj之间的相关系数。

2 问题解答

在F盘保存某地区农业生态经济系统各区域单元相关指标数data.txt(见附录)。

在R软件中输入代码:

得到如下结果:

第一主成分的贡献率为51.8%,第二主成分的贡献率为23.2%,第三主成分的贡献率为11.6%。前三个主成分的累积贡献率为86.6%,另六个主成分可舍去。

Z1=0.342X1-0.368X2-0.375X4-0.355X5+0.312X6+0.599X7+0.113X8-0.233X9

Z2=0.614X2+0.155X4-0.761X5-0.11X6

Z3=-0.446X2+0.206X6+0.467X7-0.203X8+0.692X9

从第一主成分中,可看出农业生态经济与人均耕地面积,农民人均纯收入,人均粮食产量,灌溉田占耕地面积之比,成反比,即人均耕地面积,农民人均纯收入,人均粮食产量,灌溉田占耕地面积之比越大,生态农业经济越差。

做碎石图:

建立模型:

目标变量:

农民人均纯收入(元/人)—y 决策变量:

x1:人口密度(人/km2) x 2:人均耕地面积(ha)

x 3:森林覆盖率(%) x 5:人均粮食产量 (kg/人)

x 6:经济作物占农作物播面比例(%) x 7:耕地占土地面积比率(%) x 8:果园与林地面积之比(%) x 9:灌溉田占耕地面积之比(%) 进行多元线性回归分析:

y= B0+B1x+B2x 2+B3x 3+B5x 5+B6x 6+B7x 7+B8 x 8+B9x 9

在R软件中输入:

得到以下结果

y=-1340.879-2.816X1+278.234X2+25.309X3+1.719X5-6.303X6+27.989X7-18.964X8+52.593X9

此结果不合理,对其做主成分回归检验:

由结果可得前三个主成分贡献率达到94.4%,然后进行主成分分析:

在R中建立模型:

继续建模:

本文来源:https://www.bwwdw.com/article/e1hf.html

Top