多元统计分析我国主要城市聚类分析课程设计

更新时间:2024-03-10 09:10:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

摘 要

以我国31个主要城市为研究样本,选取平均气温、平均相对湿度、降水量、日照时数、4个反映生态气候情况的主要指标,对我国主要城市气候进行聚类分析。使用spss将全国主要城市的平均气温、平均相对湿度、降水量、日照时数,利用K均值聚类分析法和系统聚类分析法进行分类,并且讨论K均值聚类分析法和系统聚类分析法的异同与哪种方法更好。

关键词:平均气温;平均相对湿度;降水量;日照时数;系统聚类;聚类分析;spss

目录

1. 设计目的 .............................................. 3 2. 聚类分析的基本思想 .................................... 3 3. 实际问题分析 .......................................... 3 4. 系统聚类分析 .......................................... 4 4.1 实际操作 .......................................... 4 4.2 结果分析 .......................................... 5 5. K均值聚类分析 ....................................... 9 5.1. 基本思想 ......................................... 9 5.2. 操作步骤 ........................................ 10 5.3. 结果分析 ........................................ 10 6.两种方法的结果比较 ................................... 15 7. 总结 ................................................. 17 参考文献 ................................................ 18

我国主要城市气候的聚类分析

1. 设计目的

了解系统聚类分析法,学会应用spss软件进行系统聚类分析。同时更好的了解应用多元统计分析的知识,熟练掌握应用多元统计分析在实际问题上的应用,并将所学的知识结合spss对数据的处理解决实际问题。本设计是利用spss软件我国31个城市的气候进行聚类分析。我国主要城市的气候利用K均值聚类分析法和系统聚类分析法进行分类,并且讨论K均值聚类分析法和系统聚类分析法的异同与哪种方法更好。

2. 聚类分析的基本思想

找出能够度量样品或指标之间相似程度的统计量以此作为划分类型的依据,把一些相似程度较大的聚合为一类另一些相似程度较大的聚合为一类,直到所有都聚合完毕形成一个由小到大的分类系统

3. 实际问题分析

下表是某年我国31个主要城市平均气温、平均相对湿度、降水量、日照时数的数据,试使用系统聚类法对这些地区进行聚类分析。

城市 北京 天津 石家庄 太原 呼和浩特 沈阳 长春 哈尔滨 上海 平均气温 12.7 12.5 14.2 11.8 7.8 7.4 5.4 4.6 17.5 平均相对湿度 54.0 60.8 58.8 55.2 46.9 67.7 57.6 58.1 68.8 降水量 571.8 544.3 517.1 431.1 397.9 690.3 570.4 524.4 1164.5 日照时数 2667.2 2247.8 2007.8 2438.7 2741.1 2366.7 2711.5 2506.5 1649.5 南京 杭州 合肥 福州 南昌 济南 郑州 武汉 长沙 广州 南宁 海口 重庆 成都 贵阳 昆明 西安 拉萨 兰州 西宁 银川 乌鲁木齐 16.7 17.2 16.8 21.1 18.9 14.9 15.8 17.1 18.7 22.9 22.6 25.4 19.1 17.7 15.3 17.3 16.4 10.9 7.5 7.5 10.6 8.6 70.3 71.3 78.3 68.3 67.7 61.3 59.2 66.8 69.6 70.8 75.5 80.0 81.1 76.7 75.1 71.8 78.1 33.8 53.3 57.1 52.3 56.0 1062.3 1454.6 995.2 1393.6 1624.4 672.7 632.4 1269 1331.3 1736.1 1309.8 1652.1 1104.4 927.5 1117.7 1011.3 1033.2 232.6 311.7 373.8 240.1 286.3 1933.3 1513.8 1704.5 1449.5 1712.3 2233.9 1880.4 1752.2 1295.9 1609.2 1478.2 1800.0 961.1 1010.2 1068.2 1995.5 1091.9 2672.9 2657.3 2534.2 2759.3 2570.5 4. 系统聚类分析

4.1 实际操作

1.操作步骤

[1]在spss将数据导入数据视图;

[2]点击spss选择 分析、分类、系统聚类;选中系统聚类分析主页面,将 城市选入标注个案,将变量平均气温至日照时数移入变量框中。单击定义组 因为本案例是对样本进行聚类,所以在分群中勾选个案,在输出选项组中勾选统计量复选框和图复选框。

[3]点击绘制按钮,选中树状图和冰柱栏中的无,点击继续按钮;

[4] 点击保存按钮,在聚类成员框中选中方案范围按钮,最小聚类数设为2,最大聚类书设为5,继续;

[5]统计量和方法都选择系统默认值; [6]点击确认按,运行系统聚类过程。

4.2 结果分析

(1)案例处理汇总表 案例处理汇总a,b 案例 有效 N 31 百分比 100.0 N 0 缺失 百分比 .0 N 31 总计 百分比 100.0 a. 平方 Euclidean 距离 已使用 b. 平均联结(组之间) 案例处理汇总表中汇总了有效数据数量31个,占百分比百分之百,缺失数据0个,占百分之零。总计数量31个,占百分比百分之百。 (2)聚类过程的结果

聚类表 群集组合 阶 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 群集 1 1 10 27 24 11 14 29 27 4 11 2 22 9 5 2 3 群集 2 7 25 28 26 13 21 31 30 8 20 15 24 17 27 6 16 系数 2030.700 6472.450 6891.980 7712.150 7879.700 8652.120 8976.360 11702.360 13361.980 15090.710 16685.780 16946.055 21471.700 23973.187 26784.820 29527.570 首次出现阶群集 群集 1 0 0 0 0 0 0 0 3 0 5 0 0 0 0 11 0 群集 2 0 0 0 0 0 0 0 0 0 0 0 4 0 8 0 0 下一阶 23 24 8 12 10 18 19 14 19 20 15 17 21 22 25 25

本文来源:https://www.bwwdw.com/article/b9c8.html

Top