多元统计分析实验报告doc

更新时间:2023-10-09 12:37:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

多元统计与程序设计》

课 程 实 验 报 告

项目名称:学生姓名:学生学号:指导教师:完成日期:

1 实验内容 2 模型建立与求解 2.1聚类分析的形成思路

2.2.1类平均法

2.2.2谱系图的形成

2.3.快速聚类法 (以上内容见课本) 3 实验数据与实验结果

3.1实验数据

设有20个土壤样品分别对5个变量的观测数据如表5.16所示,试利用 聚类法对其进行样品聚类分析

样品号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 含沙量X1 77.3 82.5 66.9 47.2 65.3 83.3 81.6 47.8 48.6 61.6 58.6 69.3 61.8 67.7 57.2 67.2 59.2 80.2 淤泥含量X2 13.0 10.0 20.0 33.3 20.5 10.0 12.7 36.5 37.1 25.5 26.5 22.3 30.8 25.3 31.2 22.7 31.2 13.2 粘土含量X3 9.7 7.5 12.5 19.0 14.2 6.7 5.7 15.7 14.3 12.6 14.9 8.4 7.4 7.0 11.6 10.1 9.6 6.6 有机物X4 1.5 1.5 2.3 2.8 1.9 2.2 2.9 2.3 2.1 1.9 2.4 4.0 2.7 4.8 2.4 33.3 2.4 2.0 PH值X5 6.4 6.5 7.0 5.8 6.9 7.0 6.7 7.2 7.2 7.3 6.7 7.0 6.4 7.3 6.3 6.2 6.0 5.8 19 20

82.2 69.7 11.1 20.7 6.7 9.6 2.2 3.1 7.2 5.9 3.2实验过程及结果 Case Processing Summary(a) Cases Valid Missing Total N Percent N Percent N Percent 20 100.0% 0 .0% 20 100.0% a Squared Euclidean Distance used

上表是接近度矩阵,计算距离使用的是平方欧氏距离,所以样品间距离越大,样品越相异,由表中矩阵可以看出样品8号和样品9号的距离是最小的,因此它们最先聚为一类。

Average Linkage (Between Groups)

Stage Cluster First Cluster Combined Stage 1 Cluster 1 Cluster 2 8 9 Coefficients .153 Appears Cluster 1 Cluster 2 Next Stage 0 0 16 Agglomeration Schedule

2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

6 3 2 12 15 3 2 13 3 1 18 3 1 3 3 1 1 1

19 5 7 14 17 10 6 15 11 2 20 12 18 13 8 3 4 16

.173 .273 .524 .624 .656 1.061 1.120 1.240 1.522 2.008 2.223 3.519 4.926 5.014 6.646 10.557 17.079 24.533

0 0 0 0 0 3 4 0 7 0 0 10 11 13 15 14 17 18

0 0 0 0 0 0 2 6 0 8 0 5 12 9 1 16 0 0

8 7 8 13 9 10 11 15 13 14 14 15 17 16 17 18 19 0

上表是反应每一阶段聚类的结果,可见第一阶段时第8个样品和第9个样品聚为一类。

聚合系数随分类数变化曲线3025聚合系数201510500510分类数1520系列1

从上曲线可以看出当分类数为4或5时,曲线变得平缓。

Dendrogram

上图是树状聚类图从图中可以看到分类情况,分为4类,结果如下第一类{16},第二类{4},第三类{1,2,6,7,18,19,20},剩下的为第四类。

上图是冰柱图,我们把它分成四类,每个样品后边有一列X,如果个数少于4,那么它与前面多于4个X的样品聚为一类,由上图很容易看出分类结果。

Quick Cluster

Initial Cluster Centers

本文来源:https://www.bwwdw.com/article/2v9f.html

Top