课 程 实 验 报 告

更新时间:2024-05-23 06:18:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

课 程 实 验 报 告

专 业 年 2012年 课 程 名 称 应用多元统计分析 指 导 教 师 *** 学 生 姓 名 ** 学 号 *************** 实 验 日 期 ********** 实 验 地 点 实验室 实 验 成 绩

教务处制 2013 年1月 12 日

实验项

目名称 系统聚类分析与主成分分析的上机实验 实验目的 SPSS软件中factor analysis的计算机操作及结果分析,使学生能熟练应用计算机 及要求 软件进行聚类分析与主成分分析与结果分析,培养实际应用能力。 题目:

实 某地区35个城市2004年的7项经济统计指标数据(见附表) (1)试用最短距离聚类法对35个城市综合实力进行系统聚类分析,验 并画出聚类谱系图。

(2)试用主成分分析法对35个城市7项经济指标进行主成分分析,内 并分析其综合实力。

注:对输出结果进行分析!

容 要求:

将SPSS软件的分析过程的关键步骤截图说明,需要计算

的地方要写出详细计算步骤。

实 聚类分析:1.选择菜单项:分析?分类?系统聚类分析,在系统聚类分析对话 验 框中将“城市编号”变量选入“标注个案(C)”中,将其他变量选入“变量框”中,如图一所 步 在“分群”单选框中选中“个案”,表示进行的是Q型聚类。在“输出”复选框中选中“统计量” 骤 和“图”,表示要输出的结果包含以上两项。

图一:

2. 单击“统计量(S)”按钮,在“系统聚类分析:统计量”对话框中

选择“合并进程表”、“相似性矩阵”,表示输出结果将包括这两项内容。

3.单击“绘制(T)”按钮,在“系统聚类分析:图”对话框中选择“树状图”、“冰柱”,表示输出的结果将包括谱系聚类图(树状)以及冰柱图(垂直)。

4.单击“方法(M)”按钮,弹出“系统聚类分析:方法”对话框。“聚类方法(M)”选项条中可选项包括的几种方法,本实验中选择“组间联接”:“度量标准-区间(N)”选项条中可选项包括的几种度量方法,本实验中选择“平方Euclidean距离”: “转换值-标准化(S)”选项条中可选项包括几种将原始数据标准化的方法,本实验中选择“全局从0到1”。

输出结果分析: 图二显示的是用平方Euclidean距离计算的近似矩阵表,其实质是一个不相似矩阵,其中的数值表示各个样本之间的相似系数,数值越大,表示两样本距离越大。 图二 近似矩阵表 图三显示的是聚类表,该表反映的是每一阶段聚类的结果,系数表示的是“聚合系数”,第2列和第3列表示的是聚合的类。 图三 聚类表 阶 群集组合 群集 1 1 2 3 4 5 6 7 17 5 33 26 30 8 20 群集 2 25 29 34 35 31 18 30 系数 .004 .004 .007 .008 .011 .012 .015 首次出现阶群集 群集 1 0 0 0 0 0 0 0 群集 2 0 0 0 0 0 0 5 下一阶 8 8 12 22 7 15 13 8 9 10 11 12 13 14 15 16 17 18 19 20 21 5 16 6 14 16 14 13 8 19 6 5 7 7 7 4 5 7 3 2 3 2 1 4 2 1 2 1 17 32 21 22 33 20 15 12 28 11 16 8 19 13 26 14 9 7 6 5 3 23 24 4 10 27 2 .016 .016 .023 .026 .027 .038 .039 .042 .046 .048 .048 .051 .060 .083 .090 .101 .114 .155 .168 .263 .280 .400 .429 .578 .817 1.677 2.211 2 0 0 0 9 11 0 6 0 10 8 0 19 20 0 18 21 0 0 25 26 0 22 28 29 31 32 1 0 0 0 3 7 0 0 0 0 12 15 16 14 4 13 0 24 17 23 27 0 0 30 0 0 33 18 12 17 13 18 23 21 19 20 26 23 20 21 24 30 27 25 27 28 28 31 32 31 33 34 34 0 图四是22 23 24 25 26 27 28 29 30 31 32 33 34 冰柱图,是反映样本聚类情况的图,如果按照设定的类数,在那类数的行上从左到右就可以找到各类所包含的样本。 图四

图五是用“组间联接”聚类法生成的树状聚类图。

图五

从聚类分析谱系图可以看出,在不同的聚类标准下,聚类结果不同: 当距离为0时,每个样本为单独的一类;当距离标准逐渐放大,35

个城市被一次聚类。当距离为5时,样本被聚为6类;当距离为10时,样本被聚为3类;当距离为15时,样本被聚为3类;当距离为20时,样本被聚为2类;当距离为25时,样本被聚为1类

主成分分析: 1. 选择菜单项:分析?描述统计?描述,在描述性对话框中将变量选入变量框中, 如图一所示,点“将标准化得分另存为变量(Z)”,点击确定。 图一 得到图二,描述统计量 图二 描述统计量 总人口 非农业人口比例 农业总产值 工业总产值 地方财政预算内收 城乡居民年底储蓄 在岗职工工资总额 有效的 N (列表状态) N 35 35 35 35 35 35 35 35 极小值 54.38 .21 4.48 66.12 4.91 81.41 17.86 极大值 3072.34 .84 416.88 5452.91 431.85 2680.66 577.33 均值 614.8580 .4800 121.1574 840.7317 66.7606 646.6091 118.4957 标准差 530.21897 .16494 94.67638 1017.73823 84.66236 622.47013 127.39093 2.选择菜单项:分析?降维?因子分析,在因子分析对话框中,将以字母Z开头的变量选入变量框内,如图三所示 图三 图四 公因子方差 总人口 非农业人口比例 农业总产值 工业总产值 地方财政预算内收 城乡居民年底储蓄 在岗职工工资总额 提取方法:主成份分析。 初始 1.000 1.000 1.000 1.000 1.000 1.000 1.000 提取 .946 .989 .915 .909 .976 .939 .954 图四给出了8个原始变量的变量共同度。变量共同度反映每个变量对提取出的所有公共因子的依赖程度。图四可以看出,所有的变量共同度都在90%以上,说明提取的因子已经包含了原始变量的大部分信息,因子提取的效果比较理想。 图五 图五给出了因子的碎石图。图中横坐标为因子的序号,纵坐标为相应特征根的值。从图中可以看到,前3个因子的特征根普遍较高,连接成了陡峭的折线,而第4个因子之后的特征根普遍较低,连接成了平缓的折线,这进一步说明提取3个因子是比较适当的。 图六 成份矩阵 a 总人口 非农业人口比例 农业总产值 工业总产值 地方财政预算内收 城乡居民年底储蓄 在岗职工工资总额 提取方法 :主成份。 a. 已提取了 3 个成份。 成份 1 .613 .212 .549 .910 .954 .963 .962 2 -.686 .866 -.775 .210 .234 .096 .162 3 .316 .442 .117 -.193 -.103 -.040 -.042 图七 a 旋转成份矩阵 总人口 成份 1 .260 .286 .243 .943 .960 .910 .927 2 .932 -.334 .870 .122 .170 .309 .258 3 -.097 .892 -.315 .069 .159 .127 .165 非农业人口比例 农业总产值 工业总产值 地方财政预算内收 城乡居民年底储蓄 在岗职工工资总额 提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。 a. 旋转在 5 次迭代后收敛。 图八 成份 1 2 成份转换矩阵 1 .903 .277 -.329 2 .417 -.750 .513 3 .104 .601 .793 3 提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。 图九 成份得分系数矩阵 总人口 非农业人口比例 农业总产值 工业总产值 地方财政预算内收 城乡居民年底储蓄 在岗职工工资总额 提取方法 :主成份。 成份 1 -.257 -.237 -.102 .396 .327 .251 .262 2 .774 .319 .517 -.268 -.144 .000 -.029 3 .501 1.245 .033 -.338 -.131 -.035 -.019 旋转法 :具有 Kaiser 标准化的正交旋转法。 构成得分。 图十 成份得分协方差矩阵 成份 1 2 3 1 1.000 .000 .000 2 .000 1.000 .000 3 .000 .000 1.000 提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。 构成得分。 附表(输入数据):

本文来源:https://www.bwwdw.com/article/ce57.html

Top