聚类判别方法建模及matlab实现

更新时间:2023-07-18 18:19:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

数学建模中一些比较常用的方法

统计分析方法建模9.1 统计聚类方法 9.2 统计判别方法

数学建模中一些比较常用的方法

9.1 统计聚类模型分类学主要靠专业知识进行分类 数学工具逐渐被引进了分类 1965模糊数学的出现 1965模糊数学的出现 统计聚类分析 模糊统计聚类分析

距离分类方法

数学建模中一些比较常用的方法

9.1 统计聚类模型利用样本的指标值对样本进行分类的统计方法称为统计聚 类分析法

聚类分析问题:设有 个样本 每个样本有p个指标值 个样本, 聚类分析问题:设有n个样本,每个样本有 个指标值

x11 x12 L x1 p x 21 x 22 L x 2 p L L x n 1 x n 2 L x np问如何按这些指标值把n个样本分成 类 问如何按这些指标值把 个样本分成k类 ? 个样本分成

数学建模中一些比较常用的方法

例:下表是同一批客户对经常光顾的五座商场在购 物环境和服务质量两方面的平均得分,现希望根据 这批数据将五座商场分3类。编号 A 商场 B 商场 C 商场 D 商场 E 商场 购物环境 73 66 84 91 94 服务质量 68 64 82 88 90

数学建模中一些比较常用的方法

9.1.1 距离和相似系数

衡量两个样本的接近程度的方法常用的有两种 一种方法是将每个样本看作 p维空间中的一个 点, 维空间中的一个 维空间中定义两点间的距离 在p维空间中定义两点间的距离,并把距离近的点 维空间中定义两点间的距离, 归成一类; 归成一类; 另一种方法是定义指标间的相似系数, 另一种方法是定义指标间的相似系数,相似系数 定义指标间的相似系数 接近1或 的两个指标相似性最大 的两个指标相似性最大, 接近 或 -1的两个指标相似性最大,把最相似的 归成一类。 归成一类。

数学建模中一些比较常用的方法

9.1.1 距离和相似系数

定义距离和定义相似系数都与数据的类型有关。 定义距离和定义相似系数都与数据的类型有关。 数据按其测量的尺度可分成如下几类 1.间隔尺度 指标用连续实变量表示 如长度、重量等 间隔尺度:指标用连续实变量表示 如长度、 间隔尺度 指标用连续实变量表示,如长度 2.有序尺度 指标度量没有明确的数量表示 只有次序 有序尺度:指标度量没有明确的数量表示 有序尺度 指标度量没有明确的数量表示,只有次序 关系,如对事物的评价分为 如对事物的评价分为好 关系 如对事物的评价分为好、中、差三个等级 3.名义尺度 指标度量既不是数量也没有次序关系,如 名义尺度:指标度量既不是数量也没有次序关系 如 名义尺度 指标度量既不是数量也没有次序关系 化学中的催化剂种类,医疗诊断中的 医疗诊断中的“ 、 化学中的催化剂种类 医疗诊断中的“+”、“-”反应等 反应等模糊统计聚类分析

数学建模中一些比较常用的方法

距离的概念 数据标准化方法 为消除各种量量纲的影响以保证各变量在分析中处于同等地位1.利用标准差进行标准化 利用标准差进行标准化1 n 1 n x j = ∑ xij s j = ( xij x j )2 ∑ n

i =1 n 1 i =1

x的标准差标准化变量为 的标准差标准化变量为 xij x j ′ xij = , i = 1,L, n, j = 1,L, p sj

数学建模中一些比较常用的方法

距离的概念 数据标准化方法2. 利用极差标准化

R j = max xij min xij1≤ i ≤ n 1≤ i ≤ n

x的极差标准化变量为 的极差标准化变量为

′ xij =

xij xj Rj

, i = 1,L, n, j = 1,L, p

用标准差标准化后和用极差标准化后的变量 其均值都为0,相应的标准差和极差均为1。 其均值都为 ,相应的标准差和极差均为 。

数学建模中一些比较常用的方法

距离的概念 常用的距离di, j ( ) 表示两个样本间的距离 xij 标准化后的数据1. 绝对距离 di , j (1) = ∑ xik x jkk =1 p

2.欧几里德(Euclid)距离 2.欧几里德(Euclid)距离 di , j (2) = 欧几里德 3.闵可夫斯基 闵可夫斯基(Minkowski)距离 闵可夫斯基 距离 di, j (q) = ∑ xik xjk k=1 p

∑( xp k =1

ik

x jk )

2

q 1/ q

q ≥1

数学建模中一些比较常用的方法

9.1.2 系统聚类方法

系统聚类法基本思想

一种逐步合并的聚类方法

先将n个样本各自看成一类 共有 类 先将 个样本各自看成一类,共有 n类; 个样本各自看成一类 然后规定样本之间的距离和类与类之间的距离 开始时,由于n个样本各自成一类 个样本各自成一类, 开始时,由于 个样本各自成一类,故类与类之 间的距离就是样本间的距离; 间的距离就是样本间的距离; 将距离最小的一对并成一个新类, 将距离最小的一对并成一个新类,计算新类与其 0.1 0.2 0.5 2 3 他类的距离,再将距离最近的类合并。 他类的距离,再将距离最近的类合并。 5 这样每次减少一类,直至满足聚类的要求为止。 这样每次减少一类 直至满足聚类的要求为止。 直至满足聚类的要求为止

6

5

4

3

数学建模中一些比较常用的方法

9.1.2 系统聚类方法

例9.3个工厂各抽一件同类产品,每个产品测两个质量 从21个工厂各抽一件同类产品 每个产品测两个质量 个工厂各抽一件同类产品 指标,记为 记为x 要求按产品质量将工厂分成4类 除 指标 记为 1 , x2 ,要求按产品质量将工厂分成 类(除 要求按产品质量将工厂分成 16、21这两个工厂外 对产品测得的数据如表 这两个工厂外). 、 这两个工厂外工厂号 x1 x2工厂号

1 0 6 11 3 4 12 -2 2

2 0 5 13 -3 2

3 2 5 14 -3 0

4 2 3 15 -5 2

5 4 4 16 1 1 0 -1

6 4 3 17 0 -2

7 5 1 18

8 6 2 19 -1 -1

9 6 1 20 -1 -3

10 7 0 21 -3 -5

x1 x2

数学建模中一些比较常用的方法

9.1.2 系统聚类方法平面直角坐标系 一个点(x 一个点 1,x2) 1=(0,6) 6=(4,3)1 2

x2

距离为1的点合成一类 距离为 的点合成一类3 11 4 5 6 8 7 9 10

15

13 12

16 14 19 17 18 202

x1

欧氏距离di , j (2) =

∑(xk =1

ik

x jk )

212

如 d1,2 = (0 0)2 + (5 6)2 = 1d5,6 = (4 4)2 + (4 3)2 = 1 d2,3 = (2 0)2 + (5 5)2 = 2 d13,4 = ( 3 + 3)2 + (0 2)2 = 2

产品与产品间的距离

数学建模中一些比较常用的方法

9.1.2 系统聚类方法

10

x2

类间的最短距离 2

1 2

3 11 5 4 6

15 -1 0

13 12 16 14 O 19 17 18 20 7

8 9 10 10

x1

21

-1 0

数学建模中一些比较常用的方法

9.1.2 系统聚类方法

10

x2

类间的最小距离为2 类间的最小距离为

1 2

3 11 5 4 6

15 -1 0

13 12 16 14 O 19 17 18 20 7

8 9 10 10

x1

21

-1 0

数学建模中一些比较常用的方法

9.1.2 系统聚类方法

常用的还有聚类方法 最长距离法 中间距离法 重心法(centroid method) 重心法 类平均法(group average method) 类平均法 离差平方和法 (瓦尔德方法 ) 瓦尔德方法

数学建模中一些比较常用的方法

数学建模中一些比较常用的方法

数学建模中一些比较常用的方法

数学建模中一些比较常用的方法

数学建模中一些比较常用的方法

例9.3的程序实现 的程序实现

x= [0,6;0,5;2,5;2,3;4,4;4,3;5,1;6,2;6,1;7,0;3,4;-2,2;... y=pdist(x,'Euclid');%利用欧氏距离计算距离 yc=squareform(y)%将距离以距阵形式输出

-3,2;-3,0;-5,2;1,1;0,-1;0,-2;-1,-1;-1,-3;-3,-5];

z=linkage(y); %生成聚类树 h=dendrogram(z);%画聚类图 t=cluster(z,4) %分成四类 find(t==2)%给出类2中的样本

数学建模中一些比较常用的方法

9.1.2 有序样本聚类方法如按时间的先 费歇最优分割法 后 地层的深浅等 适用于 样本按一定的要求排列成序分类时不能打乱这种次序

基本思想

每个位置想象为两个 样品之间的“间隔” 样品之间的“间隔”

不改变其排列次序分为k类 n个有序样本x1 ,L , xn不改变其排列次序分为 类 个

排序后每一类 xi , xi +1 , L , x j ( i < j )相当于在n-1个位置放置 个栅栏 相当于在 个位置放置k-1个栅栏 共有 Cn 1 个位置放置 个栅栏,共有 在某种误差意义下,有可能求得其最优解 在某种误差意义下 有可能求得其最优解k 1

{

}

本文来源:https://www.bwwdw.com/article/rmp1.html

Top