用spss分析我国各省城镇居民消费水平差异

更新时间:2024-06-16 02:24:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

用spss分析我国各省城镇居民消费水平差异分析

文章结构

1 研究背景及意义 ................................................................................................................................................................. 1 2 研究方法............................................................................................................................................................................. 1 3 数据来源与数据处理 ......................................................................................................................................................... 2 4. 实证分析............................................................................................................................................................................ 3 4.1因子分析 .......................................................................................................................................................................... 3 4.2 聚类分析 ......................................................................................................................................................................... 7 5 结论 .................................................................................................................................................................................. 11

1 研究背景及意义

我国地域广阔,各省份的经济发展很不平衡,各省之间的居民消费水平差距较大。经济快速发展的同时我国居民收入稳步增加,各省居民的消费支出也强劲增长,消费结构发生了巨大变化。为了正确引导消费,进一步改善消费结构,提高我国城市居民的消费水平和生活的质量,有必要对全国各省居民消费结构之间的异同进行考察并做比较研究,以期发现经济水平和城市居民的消费水平之间的关系.

2 研究方法

本文运用多元统计分析中的主成分分析方法和聚类分析方法,将描述各省份城镇居民全年现金消费支出的八个指标压缩成两个综合指标( 称为主成分) , 这两个主成分保留了原始八个指标的绝大部分信息,在指标压缩的同时能够最大限度地反映出各省份城镇居民消费水平差异。在综合因子基础上进行层次聚类分析,根据消费差异将全国31个省分为四类。

因子分析模型是根据变量间的相关性大小,把变量分组,利用同组内的变量之间相关性较高而不同组的变量之间相关性较低,每组变量代表一个基本结构,这个基本结构称为公共因子。因子分析的出发点是用较少的相互独立的因子变量来代替原来变量的大部分信息,可以通过下面的数学模型来表示: X1=α11F1+α12F2+…+α1mFm+α1ε1, X2=α21F1+α222+…+α2mFm+α2ε2, …

Xp=αp1F1+αp2F2+…+αpmFm+αpεp, 其中:x1,x2,x3,…,xp 为p 个原有变量,是均值为零、标准差为1 的标准化变量;F1,F2,F3,…,Fm 为m 个因子变量,m 小于p,表示成矩阵形式为 X=AF+αε,

其中:F=(F1,F2,…,Fm)为因子变量或公共因子;ε=(ε1,ε2,…,εp)为特殊因子;F 与ε 均为不可观测的随机变量. A=(αij) p×m 为因子载荷矩阵,αj 称为第j 个因子对第i 个变量的载荷系数. 在模型中,特殊因子起着残差的作用,被定义为彼此不相关且与公因子也不相关。 系统聚类分析的基本思想是认为所研究的样品(或指标)之间存在不同程度的相似性. 把一些相似程度较大的样品(或指标)聚合为一类,把另外一些相似程度较大的样品(或指标)又聚合为另一类,关系

密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到把所有样品都聚合完毕,把不同的类型一一划分出来,形成一个由小到大的分类系统。利用SPSS 中的聚类分析,以层次分析法结果中的因子得分为基础,在聚类分析中采用离差平方和法及欧氏平方距离对综合因子得分进行最优分割,将31个省按城市居民消费水平的高低分成4类。

3 数据来源与数据处理

2012年我国“分地区城镇居民家庭平均每人全年现金消费支出”,来自于中国统计年鉴全国 31 个省、 直辖市和自治区(港、 澳、 台不在其中)的城镇居民年平均现金消费支出的97项主要指标(单位:元) ,指标代码和指标名称列于表1,原始数据列于表2。

表1 指标名称及代码

指标代码 指标名称 指标代码 指标名称 X1 X2 X3 X4

表2 原始数据

食品 衣服 居住 家庭设备

X5 X6 X7

交通通讯 文教娱乐 医疗保险

地区 X1 X2 2111.17 2638.9 1520.59 2109.58 1881.43 1915.97 2730.23 1634.21 2042.4 2196.98 2228.76 2044.8 1789.06 1540.66 1624.57 1783.41 1651.14 1146.46 1885.99 1875.7 864.96 2031.14 1541.99

X3 1790.48 1970.94 2099.75 1551.69 1854.22 1437.08 1583.56 1753.86 1433.28 1572.35 1177.02 1594.14 1322.22 1396.97 1301.6 1371.15 1284.09 1377.26 1190.81 1193.37 1521.04 1166.59 1502.41

X4 1906.49 1610.7 1467.2 1161.39 1151.16 1288.42 1242.64 1254.71 1069.65 1125.99 1196.03 871.46 986.82 811.23 1034.3 978.26 1097.93 1125.39 1145.42 929.01 777.2 950.17 876.1

X5 4563.8 3781.51 4176.66 4133.5 3083.37 2689.51 2572.93 2961.78 2323.29 2370.23 1903.24 1780.67 1788.38 1809.72 2084.15 1476.98 1946.72 2088.64 1730.35 2110.41 2004.34 1660.27 1723.75

X6 3723.74 3695.98 2954.13 2996.59 2254.22 3077.76 1971.78 2104.83 1843.89 1655.91 1470.64 1642.7 2078.52 1932.74 1737.64 1651.92 1587.43 1626.05 1525.33 1515.91 1319.54 1280.81 1203.8

X7 1016.65 1658.37 1048.28 1228.02 1556.35 1058.11 1354.09 773.22 1309.62 1005.25 1101.56 1447.5 1212.44 1142.96 918.41 1029.55 772.75 883.56 1085.47 1063.09 993.24 1027.6 1047.28

上 海 9655.6

北 京 7535.29

广 东 8258.44

浙 江 7552.02

天 津 7343.64

江 苏 6658.37

内蒙古 5463.18

福 建 7317.42

辽 宁 5809.39

山 东 5201.32

重 庆 6870.23

吉 林 4635.27

陕 西 5550.71

安 徽 5814.92

湖 南 5441.63

湖 北 5837.93

四 川 6073.86

广 西 5552.56

河 南 4607.47

宁 夏 4768.91

海 南 6556.1

新 疆 5238.89

河 北 4211.16

黑龙江 4687.23

甘 肃 4602.33

山 西 3855.56

云 南 5468.17

江 西 5071.61

青 海 4667.34

贵 州 4992.85

西 藏 5517.69

1806.92

1631.4 1529.47 1759.89 1476.63 1512.24 1399 1361.57 1336.85 1287.93 1438.88 973.76 1173.91 1232.39 1013.53 845.18 742.22 833.15 832.52 634.09 966.23 923.7 849.94 474.69 1462.61 1575.67 1672.29 2264.23 1501.34 1549.76 1891.03 1387.45 1216.56 1388.21 1506.2 1434.3 1487.3 1097.21 1396 550.48 1180.67 1049.65 905.88 939.13 670.71 906.14 654.53 467.23

4. 实证分析

4.1因子分析

表3 描述统计量

食品 衣服 居住 家庭设备 交通通讯 文教娱乐 医疗保险

均值 5832.8094 1782.8135 1411.2358 1042.3939

标准差 1299.82194 388.89271 283.12264 283.24540

分析 N

31 31 31 31 31 31 31

2260.2768 861.61451 1836.3910 739.15111 1048.6229 253.74984

食品、衣服等七个消费支出指标的描述性统计量,可以看出,食品支出消费所占的比重最大,其次是交通通讯。在所有的消费支出中,医疗保险支出所占比重最小。

表4 KMO 和 Bartlett 的检验

取样足够度的 Kaiser-Meyer-Olkin 度量。 .698 Bartlett 的球形度近似卡方 187.287 检验 df 21

Sig.

表5 公因子方差

.000

食品

衣服 居住 家庭设备 交通通讯

初始 1.000 1.000 1.000 1.000 1.000

提取 .865 .780 .706 .829 .911

文教娱1.000 .902 乐 医疗保1.000 .844 险

提取方法:主成份分析。

通过SPSS软件得出Bartlett值为21,P值<0.05,可考虑进行因子分析;KMO值为0.698,接近1,适合进行因子分析。变量的绝大部分信息(70%以上)都可以被因子解释,这些变量信息丢失较少,本次因子提取的总体效果理想。

表6 解释的总方差 成份 初始特征值 方差合计 的 % 累积 % 提取平方和载入 方差合计 的 % 累积 % 4.623 1.214 66.048 17.345 66.048 83.392 旋转平方和载入 方差合计 的 % 累积 % 3.881 1.956 55.448 27.945 55.448 83.392 1 4.623 66.048 66.048 2 1.214 17.345 83.392 3 .563 8.042 91.435 4 .257 3.667 95.102 5 .148 2.109 97.211 6 .140 1.994 99.204 7 .056 .796 100.000 提取方法:主成份分析。 第一个因子的特征根值为4.623,解释了原有8个变量总方差的55.448%,第二个因子的特征根值为1.214,解释了原有8个变量总方差的27.945,前两个因子的累计方差贡献率为83.392%,并且只有他们的取值大于1,说明前两个公因子基本上包含来全部变量的主要信息,选择前两个因子为主因子即可。

图1 碎石图

碎石图横坐标为因子数目,纵坐标为特征根,可以看出第一个因子的特征值很高,对解释原油变量的贡献率极大,第二个以后的特征根值都很小,取值都小于1,说明他们对解释原有变量的共享率极小。

表7 成份矩阵a 成份 .576 .670 提取方法 :主成份。 a. 已提取了 2 个成份。 旋转前的因子载荷矩阵,从结果看,大部分因子解释性很好,但是仍有少部分指标解释能力较差。如医疗保险和衣服在两个因子的载荷系数区别不大,因此接着采用因子旋转方法使得因子载荷系数向着0和1两极分化,使大的载荷更大,小的载荷更小,使结果更具有解释性。

表8 旋转成份矩阵a 文教娱乐 交通通讯 家庭设备 居住 食品 医疗保险 衣服 1 .944 .920 .902 .840 .823 .597 2 -.101 -.255 -.120 -.008 -.434 .698 成份 1 .933 2 .203 交通通讯 食品 .930 .000 文教娱.882 .351 乐 家庭设.854 .315 备 居住 .747 .385 医疗保.202 .896 险 衣服 .197 .861 提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。 a. 旋转在 3 次迭代后收敛。 旋转后因子载荷矩阵,因子载荷系数向着0和1两极分化,更有意义。可以看出,第一个公因子主要反映了交通通讯、食品、文教娱乐、家庭设备和居住上有较大的载荷,说明第一个公因子主要反映这几方面的差异情况。其中,差异大小排序依次为交通通讯>食品>文教娱乐>家庭设备>居住;第二个因子反映了在医疗保险和衣服上有较大的载荷,说明第二公因子主要反映医疗保险和衣服两方面的差异情况,

其中医疗保险>衣服。

表9 成份得分系数矩阵 成份 1 .324 -.147 .164 .219 2 -.233 .546 .079 .004 食品 衣服 居住 家庭设备 交通通.274 -.093 讯 文教娱.220 .021 乐 医疗保-.154 .569 险 提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。 构成得分。 根据表中的内容,可以写出以下因子得分函数:

F1=0.324*X1-0.147*X2+0.164*X3+0.219*X4+0.274*X5+0.220*X6-0.154*X7 F2=-0.233*X1+0.546*X2+0.079*X3+0.004*X4-0.093*X5+0.021*X6+0.569*X7

有了F1和F2的合理解释,可以将各省的相关数据代入因子模型中计算出各因子得分. 同时,以各因子的方差贡献率占2个因子总方差贡献率的比重为权重加权汇总,得出各省的综合因子得分F,即F=0.55448F1+0.27945 F2得到的各因子及综合因子的得分数值及排序见表. 表中因子得分情况及其正负仅表示该城市与平均水平的相对位置。

表10 因子及综合因子得分数值及排名

地区 上 海 北 京 广 东 浙 江 天 津 江 苏 内蒙古 福 建 辽 宁 山 东 重 庆 吉 林 陕 西 安 徽 F1排名 F1

3.02862 1 1.5295 3 2.37253 2 1.30964 4 0.75736 7 0.85997 6 -0.24202 15 1.25892 5 -0.20651 14 -0.14855 12 -0.18138 13 -0.87617 29 -0.34483 17 -0.27165 16 F2排名 F2

-0.37344 21 2.31666 1 -0.78112 24 0.4249 11 1.05422 4 0.06022 14 2.10182 2 -1.06226 26 0.9538 5 0.62602 6 0.52346 8 1.57183 3 0.45924 9 -0.08056 18 F

1.57 1.5 1.1 0.84 0.71 0.49 0.45 0.4 0.15 0.09 0.05 -0.05 -0.06 -0.17 F排名 1 2 3 4 5 6 7 8 9 10 11 12 13 14

湖 南 湖 北 四 川 广 西 河 南 宁 夏 海 南 新 疆 河 北 黑龙江 甘 肃 山 西 云 南 江 西 青 海 贵 州 西 藏 -0.11365 -0.36402 0.0731 0.19853 -0.67591 -0.6658 0.18502 -0.79803 -0.74658 -1.08771 -0.83402 -0.74158 -0.70268 -0.38569 -0.74245 -0.45204 -0.99194 11 18 10 8 22 21 9 27 26 31 28 24 23 19 25 20 30 -0.4585 0.02441 -0.85478 -1.20919 0.43522 0.29833 -1.50236 0.38729 0.01241 0.57895 0.03426 -0.26244 -0.35135 -1.13609 -0.48647 -1.35804 -1.94644 22 16 25 28 10 13 30 12 17 7 15 19 20 27 23 29 31 -0.19 -0.2 -0.2 -0.23 -0.25 -0.29 -0.32 -0.33 -0.41 -0.44 -0.45 -0.48 -0.49 -0.53 -0.55 -0.63 -1.09 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

分析F1,上海、广东、北京具有较高的消费水平,公共因子得分为正的城市有10 个城市,且都具有比较发达的经济发展水平,在经济发展到一定水平后,人们的消费理念也上升到了较高的层次。黑龙江、西藏等经济欠发达的省份,居民的消费也会受到一定的制约。居民在食品、交通通讯、家庭设备、居住和文教娱乐5 个方面的消费水平与经济发展水平有密切的相关性。

分析F2,北京、内蒙古、吉林和天津等省市的消费水平高,西藏、海南、贵州和广西等地区消费水平低。而上海、广东两个较为发达的省市排在第21、24 位. 这说明衣服和医疗保险等方面的消费水平与地区的经济水平虽然有一定的相关性,但也受其它因素的影响。

分析分析综合因子得分F,居民消费水平较高的是上海、北京、广东、浙江和天津等省市,较低的为西藏、贵州、青海和江西等省,得分为正的有11个省,说明各省城市居民消费水平发展不均衡。

4.2 聚类分析

表11 聚类表 阶 1 2 3 4 5 6 7 8 9 10 11 群集组合 群集 1 群集 2 19 16 16 7 23 3 12 10 16 2 7 20 25 22 15 27 9 30 28 18 14 17 系数 .003 .005 .010 .020 .033 .046 .060 .080 .104 .137 .173 首次出现阶群集 群集 1 群集 2 下一阶 0 0 2 0 0 0 0 0 3 0 4 0 0 0 0 0 0 0 0 0 0 0 17 3 9 11 17 22 13 18 18 15 21 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

6 12 1 2 5 19 10 4 19 7 3 10 4 2 7 3 1 3 1 8 13 21 26 6 23 16 11 29 19 5 12 24 4 31 10 2 7 3 .211 .249 .313 .380 .456 .534 .620 .725 .857 1.050 1.289 1.550 1.856 2.655 3.456 4.498 6.219 8.444 16.162 0 7 0 10 0 1 8 0 17 11 6 18 19 15 21 22 14 27 28 0 0 0 0 12 5 9 0 0 20 16 13 0 24 0 23 25 26 29 16 23 28 25 22 20 23 24 21 26 27 27 25 28 29 29 30 30 0 Spss首先给出了进行系统聚类分析过程表,第一列列出了聚类过程的步骤号,第二列和第三列列出了某一步骤中那些省市进行了合并,例如从结果中可以看出,19和20首先被合并在一起。第四列列出每一步骤的聚类系数,这一数值表示被合并的两个类别之间的距离大小,第五列和第六列表示参与合并的省市在第几步中第一次出现,0代表该记录是第一次出现在聚类过程中,第七列表示在这一过程中合并的类别,下一次将在第几步中与其他类进行再一次合并。 得到以下结果:

表12 群集成员 案例 4 群集 1 2 3 2 3 3 4 3 3 3 2 3 3 1:北 京 2:内蒙古 3:吉 林 4:天 津 5:辽 宁 6:山 东 7:黑龙江 8:重 庆 9:陕 西 10:河 南 11:浙 江 12:新 疆 13:宁 夏 14:江 苏 15:甘 肃 16:湖 北 17:河 北 18:安 徽 19:山 西 20:云 南 21:上 海 22:湖 南 23:青 海 24:广 东 25:四 川 26:福 建 27:江 西 28:广 西 29:贵 州 30:海 南 31:西 藏 2 4 3 4 3 4 4 1 3 4 2 3 2 4 3 4 3 4

图2 树状图

第一类:北京、上海

第二类:内蒙古、天津、浙江、江苏、广东、福建

第三类:吉林、辽宁、山东、重庆、陕西、河南、新疆、宁夏、湖北、安徽、湖南、四川、广西、海南 第四类:黑龙江、甘肃、河北、山西、云南、青海、江西、贵州、西藏

为了进一步分析4大类省市在各个消费领域支出的变化情况,计算各类省市在各个消费领域的平均支 出。

表13 4大类省市在各个消费领域支出情况

地区 第一类 第二类 第三类 第四类

支出比重 支出 比重 支出 比重 支出 比重

X1 8595.445 0.360701 5722.438 0.370381 5568.514 0.38862 4785.993 0.394595 X2 2375.035 0.099667 1711.903 0.110802 1764.716 0.123157 1557.679 0.128427 X3 1880.71 0.078923 1363.402 0.088245 1350.135 0.094224 1200.538 0.098982 X4 1758.595 0.073798 1016.387 0.065785 1007.061 0.070282 792.5156 0.065341 X5 4172.655 0.175102 2573.515 0.166569 1934.099 0.134978 1669.792 0.137671 X6 3709.86 0.155681 2067.53 0.133819 1633.502 0.114 1253.34 0.103335 X7 1337.51 0.056128 994.965 0.064398 1070.929 0.074739 869.0244 0.071649

四大类城市各项指标平均消费比重0.450.40.350.30.250.20.150.10.050食品衣服第一类居住家庭设备交通通讯文教娱乐医疗保险第三类第四类第二类 图3 四大类省市各项指标平均消费比重

随着消费水平的提高,4大类省市居民在反映生活水平高低的重要指标食品支出方面虽然在总量上呈现下降趋势,但相对于总消费支出的比重却呈不断上升趋势,在衣着、居住方面的支出也有相同的变化趋势;在家庭设备、医疗保健、交通通信、娱乐文教等方面的支出无论是总量还是比重都呈现出不断下降的趋势. 由此可见,随着经济发展水平和消费水平的提高,人们不仅物质生活质量不断提高,而且更加注重精神文化生活方面的消费,在保证生存型消费的基础上,更注重发展型和享受型消费,消费结构逐渐趋向合理化。但同时也应看到,我国居民总体消费水平还不高,处于第3类的省市仍较多,处于第4类的省市各个领域消费水平都很低。

5 结论

(1)因子分析:

F1=0.324*X1-0.147*X2+0.164*X3+0.219*X4+0.274*X5+0.220*X6-0.154*X7 F2=-0.233*X1+0.546*X2+0.079*X3+0.004*X4-0.093*X5+0.021*X6+0.569*X7

F=0.55448F1+0.27945 F2

上海、广东、北京具有较高的消费水平,公共因子得分为正的城市有10 个城市,且都具有比较发达的经济发展水平,在经济发展到一定水平后,人们的消费理念也上升到了较高的层次。黑龙江、西藏等经济欠发达的省份,居民的消费也会受到一定的制约。居民在食品、交通通讯、家庭设备、居住和文教娱乐5 个方面的消费水平与经济发展水平有密切的相关性。

北京、内蒙古、吉林和天津等省市的消费水平高,西藏、海南、贵州和广西等地区消费水平低。而上海、广东两个较为发达的省市排在第21、24 位. 这说明衣服和医疗保险等方面的消费水平与地区的经济水平虽然有一定的相关性,但也受其它因素的影响。

分析分析综合因子得分F,居民消费水平较高的是上海、北京、广东、浙江和天津等省市,较低的为西藏、贵州、青海和江西等省,得分为正的有11个省,说明各省城市居民消费水平发展不均衡。 (2)聚类分析 第一类:北京、上海

第二类:内蒙古、天津、浙江、江苏、广东、福建

第三类:吉林、辽宁、山东、重庆、陕西、河南、新疆、宁夏、湖北、安徽、湖南、四川、广西、海南 第四类:黑龙江、甘肃、河北、山西、云南、青海、江西、贵州、西藏

随着消费水平的提高,4大类省市居民在反映生活水平高低的重要指标食品支出方面虽然在总量上呈现下降趋势,但相对于总消费支出的比重却呈不断上升趋势,在衣着、居住方面的支出也有相同的变化趋势;在家庭设备、医疗保健、交通通信、娱乐文教等方面的支出无论是总量还是比重都呈现出不断下降的趋势. 由此可见,随着经济发展水平和消费水平的提高,人们不仅物质生活质量不断提高,而且更加注重精神文化生活方面的消费,在保证生存型消费的基础上,更注重发展型和享受型消费,消费结构逐渐趋向合理化。但同时也应看到,我国居民总体消费水平还不高,处于第3类的省市仍较多,处于第4类的省市各个领域消费水平都很低。

本文来源:https://www.bwwdw.com/article/9qz3.html

Top