实验六 各国家和地区男子径赛记录数据的聚类分析

更新时间:2023-05-25 09:50:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

实验六 各国家和地区男子径赛记录数据

的聚类分析

一、实验目的

1.掌握如何使用SAS软件来进行聚类分析;

2.看懂和理解SAS输出的结果,并学会以此来作出分析;

3.对同一组数据使用五种系统聚类方法,学会对各种聚类效果的比较,获取重要经验;

二、实验内容

实验1 下表中列出各国家和地区男子径赛记录的数据,试分别用类平均法、离差平方和法和k均值法进行聚类分析,聚类前先对各变量做标准化变换。

三、实验要求

1.完成三种系统聚类方法,比较其聚类效果; 2.能对试验结果进行合理分析.

四、实验内容

4.1完成三种系统聚类方法,比较其聚类效果 4.1.1导入数据集

exec65

4.1.2类平均法聚类

proc cluster data=work.exec65 method=ave nosquare std; id nation;

proc tree horizontal; id nation; run;

答:用类平均法聚类的话认为较合适的是聚成4类,但分成两类以上的话,库克群岛和西萨摩亚都会单聚1类,可知用类平均法的聚集效果一般。 4.1.3离差平方和法聚类

答:用离差平方和法聚类认为较适合的是聚成4类,但库克群岛和西萨摩亚聚成1类,聚集效果尚可。 4.1.4 k均值法聚类 初始凝聚点:

观测所归类及与最终凝聚点的距离:

聚类汇总:

各变量的类内均值及标准差:

答:用k均值法聚类的话认为较合适的是聚成5类,但库克群岛和西萨摩亚都单成1类,聚集效果一般。

4.2对试验结果进行合理分析

从类平均、离差平方和、k均值三种聚类方法所得结果来看,类平均和离差平方和都聚成4类,k均值则是聚成5类。而聚类情况则是类平均和k均值把库克群岛、西萨摩亚各自单成1类,离差平方和则是合成1类,相比较而言还是离差平方和法的聚集效果更好一些。

所以实验1对于各国家和地区男子径赛记录的数据用离差平方和法聚类效果更好,聚成4类,其中库克群岛和西萨摩亚聚单独成1类。

本文来源:https://www.bwwdw.com/article/q8t4.html

Top