聚类分析
更新时间:2023-09-22 17:29:01 阅读量: 经管营销 文档下载
SPSS的聚类分析
1、 已知我国南方8个少数民族11个生活方式指标的均值数据,进行层次聚类分析,部分结果如下:
1) 结合上述分析结果,说明这8个少数民族依据生活方式的聚类过程。
根据聚类状态表分析得出:第一步中,广西瑶族与广西侗族聚成一小类,个体距离是3.722,这个小类将在下面第二步中用到
第二步中,广西瑶族和贵州苗族聚成一类,个体距离是9.970,这个小类将在下面第四步中用到
第三步中,崩龙族和白族聚成一小类,个体距离是11.556,这个小类将在下面第五步中用到 第四步中,广西瑶族与基诺族聚成一小类,个体距离是18.607,这个小类将在下面第六步中用到
第五步中,土家族和崩龙族聚成一小类,个体距离是20.337,这个小类将在下面第六步中用到
第六步中,广西瑶族与土家族聚成一类,个体距离是22.262,这个小类将在下面第七步中用到
第七步中,广西瑶族与湖南侗族聚成一小类,个体距离是31.020,经过七步类聚过程,8个样本最后聚成一大类
2) 结合上述分析结果,绘制聚类树形图。
* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ 广西瑶族 1 广西侗族 3 贵州苗族 8 基诺族 6 土家族 4 崩龙族 5 白族 7 湖南侗族 2
3) 如果将这8个少数民族依生活方式分成三类,哪些少数民族分为了一类?
广西瑶族与广西侗族、贵州苗族、基诺族为一类,土家族与崩龙族、白族为一类,湖南侗族自成一类
2、 根据“高校科研研究.sav”数据,利用层次聚类分析对各省市的高校科研情况进行层次聚类分析。要求:
1) 根据凝聚状态表利用碎石图对聚类类数进行研究。
3530252015105002E+104E+106E+10距离8E+101E+11类数31个省市自治区聚类分析碎石图
2) 绘制聚类树形图,说明哪些省市聚在一起。
* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * *
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+
?÷2? 26 ?? ?t?? 30 ?? ?ào£ 29 ?? 1ó?Y 24 ?? D??? 31 ?? 1??÷ 20 ?? ???? 25 ?? oúáú? 8 ?? oó?? 16 ?? ?ú?é 5 ?? ???ì 22 ?? ?ê?à 28 ?? ??÷ 14 ?? é??÷ 4 ?????? °2?? 12 ?? ? o£?? 21 ?? ? ?aá? 7 ?? ? ??? 11 ?? ?
ìì?ò 2 ?? ? oó±± 3 ?? ?
áé?t 6 ?? ????????????????????????????????????????????? ??′¨ 23 ?? ? ? ?£?¨ 13 ?? ? ? é??? 15 ?? ? ? é??÷ 27 ?? ? ? ??? 10 ?? ? ? 1??? 19 ?? ? ? é?o£ 9 ?????? ? ot?? 18 ?? ? ot±± 17 ?? ? ±±?? 1 ????????????????????????????????????????????????
3) 绘制各类的科研指标的均值对比图。
4) 利用方差分析方法分析各类在哪些科研指标上存在显著差异。
3、 试说明当变量存在数量级上的差异,进行层次聚类分析时为什么要对数据进行标准化处理?
答:聚类分析是以各种距离来度量个体间的“亲疏”程度的。从各种距离的定义来看,数量级将对距离产生较大的影响,并影响最终的聚类结果。进行层次聚类分析时,为了避免上述问题,聚类分析之前应首先消除数量级对聚类的影响,对数据进行标准化就是最常用的方法。
4、 试说明变量之间的高度相关性是否会对层次聚类分析结果造成影响?为什么?
答:变量之间的高度相关性会对层次聚类分析结果造成影响,因为从各种距离的定义来看,所选择的每个变量都会在距离中做出“贡献”。如果所选变量之间存在较高的线性关系,能够相互替代,那么计算距离同类变量将重复“贡献”,将在距离中有较高的权重,因而使最终结果偏向该类变量。
5、 试说明K-Mean聚类分析的基本步骤。
答:K-Mean聚类分析的基本步骤是:第一步,指定聚类数目K
第二步,确定K个初始类中心
第三步,根据距离最近原则进行分类 第四步,重新确定K个类中心
第五步,判断是否已满足终止聚类分析的条件
正在阅读:
聚类分析09-22
那年我们一起去看海11-03
经典美文:生命的旅途有你是一种美丽11-21
申诉书02-18
(小型农田水利重点县项目施工组织设计)07-12
计算机组成原理与汇编语言程序设计课后习题答案(第2版)12-09
校企合作的问题、原因以及解决方法07-06
云南农业大学2012届毕业生基本信息表03-31
中班阅读 一起去郊游01-31
娃哈哈销售部工作手册05-10
- 教育局拟征求中考升学奖励制度
- 2020房地产销售主管年终工作总结
- 虚拟多台位互感器检定装置投资项目可行性分析
- 车间工人辞职报告范本
- 溴投资项目可行性分析
- 改名字申请书怎么写
- 忧与爱作文素材
- 溴苯腈投资项目可行性分析
- 2020清华大学考研复试时间:3月6日至22日
- 2020年蚌埠高考查分系统网址
- 2020年二建《建筑工程实务》测试题及答案(13)
- 生死感悟——人间世观感一
- 武陵源区军地小学观看魏书生《如何当好班主任》讲座录像
- 全球10大安全旅游国出炉日本排名第9
- 企业策划书模板
- 高中英语教师工作总结3篇
- 法定代表人证明范本
- 大学助学金申请书范文1700字
- 案外人申请不予执行仲裁裁决司法解释施行首份申请书递交齐齐哈尔...
- 环球国际房地产开发项目策划
- 分析
- 微生物发酵
- 牛津英语8B 期末试卷 二 有答案 - 图文
- Java数据库编程机试测试题
- 依赖心态与自主心态
- 2007-2012江苏专转本计算机历年统一考试试题
- 第五章 - - 信用证结算方式
- 计算机网络复习总结
- 常用金属材料显微组织观察实验报告 - 图文
- 北大15年秋英语3作业6答案
- A Brief History of English Teaching in China
- (整理)桥墩基坑支护工程整体施工方案 - 图文
- 主管护师小三门讲义:护理质量管理
- 《液压与气动》练习题含答案
- 学习微观经济学的感悟
- 浅谈如何演奏莫扎特《降E大调第三圆号协奏曲》
- 危险化学品安全专项整治工作总结
- 广东省汕头市金山中学10届高三上期期末语文试卷参考答
- 知识梳理(历史)
- 11-12-2《统计学B》期末考试题型(南院)
- 河北省成人高等教育本科毕业生申请授予学士学位外国语水平统一考试