高级统计学-判别分析作业

更新时间:2023-11-09 00:35:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

全国各地区消费水平的实例判别分析

摘要:针对我国各省(直辖)市的2009年度消费水平数据,选取9个经济指标进行

系统聚类分析,得到我国3类不同的地区消费水平类型;利用实例进行判别分析, 结合实际情况分析结果。聚类结果为制订有针对性的地区消费市场战略提供依据。

关键词:SPSS;判别分析;消费水平。 1.引言

由于传统的经济发展起点不同,加上地域、资源、技术和政策等条件的差异,各个地区的经济发展水平高低不齐,导致各地区的工资水平和消费水平的不同。因此,对各地区消费水平进行分类、比较和研究,总结出有助于市场调节和商业发展的对策,有针对性地制订地区经济发展战略,对促进国民经济协调发展有重要意义。聚类分析和判别分析是是进行以上分析的两个重要的方法。

1.1判别分析

定义:判别分析是一种进行统计判别和分组的技术手段。根据一定量案例的一个分组变量和相应的其他多元变量的已知信息,确定分组与其他多元变量之间的数量关系,建立判别函数,然后便可以利用这一数量关系对其他未知分组类型所属的案例进行判别分组。

判别分析的基本思想:对已知分类的数据建立由数值指标构成的分类规则即判别函数,然后把这样的规则应用到未知分类的样本去分类。

本文针对我国各省(直辖)市的2009年度消费消费价格分类指数数据,考虑到数据的可得性和来源的权威性,选取9个消费指标进行系统聚类分析并假定上年相应价格指数为100,得到我国3类不同的地区消费水平类型;并利用实例进行判别分析,以确认聚类效果。聚类结果将为制订有针对性的地区经济发展战略提供依据。下述数据来源于《中国统计摘要-2010》,利用社会经济统计软件SPSS19.0建立数据库并对数据进行分析处理。

表-1:国内 31个省、直辖市、自治区的9项消费指标数据

居民消费价烟酒及用品食品X2 格指数X1 X3 衣着X4 品及服务X5 个人用品X6 X7 化X8 家庭设备用医疗保健和交通和通信娱乐教育文居住X9 地区 北 京 河 北 内蒙古 98.5 99.3 102.4 101.0 101.3 101.0 102.1 100.9 100.7 100.8 99.0 100.1 101.3 101.3 100.5 100.3 98.5 98.5 99.9 100.0 102.0 98.5 101.6 103.9 102.3 103.5 101.6 102.1 102.2 101.9 100.8 101.1 100.8 101.7 100.5 101.2 102.1 100.4 102.4 101.7 101.4 100.2 102.7 100.8 100.9 101.6 101.8 100.9 100.1 101.9 101.5 102.6 102.1 101.5 98.4 96.4 99.7 99.2 99.3 99.0 98.2 97.1 96.3 99.0 97.2 99.7 99.1 100.0 97.3 97.8 98.6 94.7 98.1 95.6 98.1 101.6 99.3 99.8 99.2 98.6 100.3 99.8 99.3 102.1 101.5 101.3 99.8 99.0 100.3 101.3 100.1 100.4 100.2 100.5 99.3 98.6 101.9 97.2 100.8 99.6 100.3 99.3 99.6 101.4 100.9 101.9 99.9 101.5 101.0 101.2 99.4 100.7 102.4 101.2 101.3 101.1 101.3 101.9 101.4 100.2 100.9 100.5 104.3 99.4 101.1 100.9 101.5 101.4 101.6 101.4 101.7 101.9 95.9 97.0 97.2 97.6 97.5 96.7 96.0 97.9 96.9 97.3 98.1 97.8 98.4 98.2 97.4 97.9 98.1 98.2 99.3 98.2 97.4 97.0 99.4 97.5 98.4 99.0 97.6 97.8 98.7 99.3 98.0 99.9 98.4 100.3 98.3 100.3 100.8 101.2 98.9 101.1 98.0 99.8 99.6 98.5 101.2 100.2 98.8 99.1 98.8 100.3 100.0 99.9 89.8 98.4 98.0 99.0 96.6 97.5 92.7 94.0 94.8 96.5 98.8 93.9 97.7 96.9 93.5 92.0 94.0 95.9 99.7 98.4 101.9 100.0 99.2 101.0 101.7 99.9 99.7 吉 林 100.1 上 海 99.6 江 苏 浙 江 安 徽 福 建 99.6 98.5 99.1 98.2 江 西 99.3 山 东 100.0 河 南 湖 北 湖 南 广 东 广 西 海 南 99.4 99.6 99.6 97.7 97.9 99.3 重 庆 98.4 四 川 100.8 贵 州 98.7 云 南 100.4 西 藏 101.4 陕 西 100.5 甘 肃 101.3 宁 夏 100.7 新 疆 100.7 其中,北京、河北、山东、贵州、重庆五省、直辖市、自治区将作为实例样本数据利用判别分析进行分组归类,以检验聚类分析中的聚类结果。

2.判别分析 2.1判别分析步骤

将国内21省、直辖市、自治区的9项消费价格指标数据输入SPSS,做判别分析,具体步骤为:

(1) 在数据编辑窗口的主菜单中选择“分析(A)”→“分类(F)”→“判别(D)”(如图-1所示)。

图-1

(2) 弹出“判别分析”对话框,将“Group”变量选入“分组变量(G)”中,设置定义变量组的范围为1到3,将其他变量选入“自变量”中,并选择“使用步进式方法”如图-2所示。

图-2

(3)单击“统计量(S)”按钮,如图-3所示,依次选择“均值”、“单变量ANOVA”、“Box’s M”、“Fisher”、“未标准化”选项,各个选项表达的意思分别为:进行均数估计;进行各组均值相等检验;各组协方差阵相等检验;生成Fisher判别方程系数;生成Bayes判别方程系数。“方法(M)”保持默认设置。

图-3

(4)单击“分类(C)”按钮,如图-4所示,依次选择“根据组大小计算”、“个案结果”、“摘要表”、“不考虑该个案时的分类”、“在组内”、“合并图”选项,各选项相应意义分别为:选择样本量百分比为先验概率;显示每个单位判别后所属类别;显示判别符合率表;剔出某观察单位所建立的判别函数判别该观察单位所属类别;组内协方差阵;类别显示在同一散点图中。

图-4

(5)单击“保存(A)”按钮,如图-5所示,依次选择“预测组成员”、“判别得分”、“组成员概率”选项,各选项意义分别为:在数据中保存判别后数据所属类别;在数据中保存数据的判别分;观察单位属于某一类的概率。

图-5

(6)点击图-2中“确定”按钮开始进行判别分析。

2.1判别分析结果 表-2 分析案例处理摘要 未加权案例 有效 排除的 缺失或越界组代码 至少一个缺失判别变量 缺失或越界组代码还有至少一个缺失判别变量 合计 合计 0 21 .0 100.0 N 21 0 0 0 百分比 100.0 .0 .0 .0 表-2中分别为有效个案、缺失个案和个案总数的个数和百分数。此表中表明有21个变量100%录入,没有缺失值。

表-3 组均值的均等性的检验 Wilks 的 Lambda .125 .400 .863 .469 .655 .986 .782 .898 .168 F 62.873 13.518 1.424 10.206 4.741 .127 2.505 1.017 44.709 df1 2 2 2 2 2 2 2 2 2 df2 18 18 18 18 18 18 18 18 18 Sig. .000 .000 .267 .001 .022 .881 .110 .381 .000 居民消费价格指数 食品 烟酒及用品 衣着 家庭设备用品及服务 医疗保健和个人用品 交通和通信 娱乐教育文化 居住 表-3显示的是各自变量的方差分析及λ统计量,λ统计量在0到1之间,越接近与0组间差异越显著,越接近与1组间差距越小。Sig.表示三类分组中各变量的差异程度,小于0.05有显著差异。

表-4中可以看到各个类别中变量及总变量的均值、方差和标准差等。

本文来源:https://www.bwwdw.com/article/24yv.html

Top