模糊聚类分析在我国部分城镇居民消费结构研究中的应用

更新时间:2023-04-23 19:49:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

模糊聚类分析在我国部分城镇居民消费结构研究中的应用

姜艳 指导老师:杨成福

(河西学院数学与统计学院 甘肃 张掖 734000)

摘 要 随着GDP的稳定高速增长,我国城镇居民的消费水平发生了翻天覆地的变化,家庭各类支出结构的变化充分证明了这个历史性的巨变.在本文中,将通过模糊聚类分析的方法多我国20个城市的居民消费情况进行聚类,并分析现阶段我国城镇居民消费结构所呈现的特点,以促进未来城镇居民消费水平的合理发展及经济稳定增长. 关键词 消费结构;模糊聚类;传递闭包;模糊等价矩阵 中图分类号 O159

1.引言

城镇居民的消费水平不断提高是我国经济稳定快速发展的必要条件,所以我们只有不断促进城镇居民消费水平提高,才能更好地发展经济,提升我国在国际上的地位.而要提高我国城镇居民的消费水平,首先应该做的是了解我国的城镇居民消费结构,只有在了解了城镇居民消费结构的基础上才能对消费水平,及经济上存在的问题予以相应地解决,达到良好的经济发展状态,以此促进我国经济高速稳定的发展.

所谓聚类分析就是根据事物间的不同特征、亲疏程度和相似性等关系,对它们进行分类的一种数学方法,由于在现实生活中,事物间的关系其界限往往是不分明的,即为模糊关系,故利用模糊数学方法进行聚类会显得更自然,更符合客观实际.本文先对给定的样本,根据模糊数学聚类分析理论原则[2]进行最符合实际的分类,而对于待预测样本,可以采用它与已测样本的相似系数最大原则[3],判断其属于哪一个分类,即可得到关于我国部分城市居民消费结构的分类,达到了聚类分析的目的.

2.基于模糊等价关系的聚类分析方法[2] 2.1 模糊等价关系理论 2.1.1 经典等价关系

定义2.1.1[2] 设R是集合U= u1,u2,...,un 上的一个关系,若 ui U都是

uiRui,则称R是自反关系;对于 ui,uj U,如果uiRuj,则必有ujRui,称R是对称关系;对于 ui,uj,uk U,如果uiRuj,且ujRuk,则必有uiRuk,称R是传递关系.满足自反、对称、传递的关系,称为等价关系. 2.1.2 模糊等价关系

由于模糊关系不同于明确关系,任何两个元素之间不能用是、非来判定两者间是否最存在这一关系.因此,需要重新定义模糊关系的自反、对称、传递的关系.

~

设R是U中的模糊关系,若

~

(1) 对于 u U,有 R~ u,u 1,则R是自反的;

~(2) 对于 ui,uj U,有 R~ ui,uj ~ uj,ui ,则R是对称的; R

~(3) 对于 ui,uj,uk U,有 R~ ui,uk ~ ui,uj ~ uj,uk ,则R是传递RR

的.

~

定义2.1.2[2] 若R是满足自反性和传递性的模糊关系,则称R为模糊相容关

系;满足传递性的模糊相容关系称为模糊等价关系,相应的模糊关系矩阵分别称为模糊相容矩阵和模糊等价矩阵.

~~

设R是U上的模糊等价关系,隶属函数为 R~ ui,uj ,R 为R的 截集

0,1 ,R

~ uiuj ,ui,uj U,R是U U的普通子集. ui,uj R

~

定理2.1.2[2] 若R 是U中的模糊等价关系R的 截集,则R 是U中的等价

关系.

2.1.3 模糊关系的传递闭包

~~

定义2.1.3[2] 设R是U中的模糊关系,则U中的模糊关系tR满足:

~

(1)tR

~

t R ; ~~

(2)t R R;

2

~~~~~

(3)设R1是U中的传递关系,且R1 R,必有R1 tR.

~~

则称tR是R的传递闭包.

~~

定理2.1.3[2] 设R Mn n是模糊相容矩阵,则存在一个正整数m n,Rm为

模糊等价矩阵.

~

2.1.3[2]定理说明,对于给定的模糊相容矩阵R,可以用平方自乘方法

~~~~K~~

R R2 R4 ... R2 ...经过有限次合成运算求得tR,且tR是模糊等

价矩阵.

2.2 基于模糊聚类分析在模型中的求解过程 2.2.1 求R的传递闭包

~~

利用上述提及的定理2.1.3[2中的矩阵的自乘方法求得R的传递闭包tR.

2.2.2 聚类原理

~~~

适当选取置信水平值 0,1 ,求出tR的 截矩阵tR ,然后按照tR 进

~~

rij n n,tR行分类,具体原则:设tR ~

~r

ij

n n

~1,rij ~,则rij ~,对于

0,rij

ui,uj U,若~rij 1,则在 水平之上的将对象ui,uj归为同一类.当 在 0,1 中取不同的值时,所分的类也会发生相应的变化.

2.2.3 做动态聚类图

画出相应的动态聚类图是为了更为直观的观察被分类对象的亲疏相关程度,

~

通常将tR中所有互不相同的元素rij按从大到小的顺序进列:1 1 2 ... m,

让 取遍 m,1 上的值,将所分得的一系列类别画到同一个动态图上,即得到动态聚类图.

3.我国城市居民消费结构模型的分析 3.1 分类标准的确定

为研究我国部分城镇居民消费结构,将我国的20个城市U u1,u2,...,u20 ,其中u1,u2,...,u20分别代表:北京、天津、山西、内蒙古、辽宁、黑龙江、上海、浙江、福建、河南、湖南、广西、海南、重庆、云南、西藏、陕西、甘肃、青海、新疆作为研究对象,取定八个研究指标分别为:城市居民消费水平、人均粮食支出(元/人)、人均副食支出(元/人)、人均烟酒、饮料支出、人均其他副食支出、人均衣着支出、人均水电燃料支出、人均其他非商品支出,在这些城市相应指标对应的数据矩阵为:

21.30

21.50 21.84

21.32 22.74

21.33

21.13 19.96

25.56 19.07U

20.25 18.70

16.16

18.18 22.30

29.67 20.03

18.68 20.33

21.03

124.89122.3966.3867.08115.8875.50168.69142.24171.6573.18104.45131.35139.92120.3999.08146.9070.7572.7475.6478.55

35.4329.0818.0520.2828.2114.0040.8143.3322.3018.0120.7211.6912.9826.1833.3664.5119.7523.7220.8814.35

73.9851.6431.3235.2742.4429.5670.1250.7440.5329.3838.1532.0623.5837.9432.0154.3634.9538.6933.8634.33

93.0155.0474.4881.0758.0769.2974.32101.7757.1364.5162.9841.5424.8768.1652.0686.1053.2962.4153.8164.98

20.5811.308.1910.949.638.2415.4612.9212.608.9112.6710.8410.7611.647.0414.7710.559.6510.069.83

43.9754.8834.9739.4648.6542.0850.9053.4454.0338.1439.1642.7732.3538.4832.8532.1938.2035.2632.8233.87

433.73

288.13 177.45

182.20 194.85 165.90

422.74 394.55

225.08 155.45

213.56 178.51

144.21

246.37 190.04

193.10 189.41

170.12 171.32

161.67

3.2 数据标准化构造相似矩阵

在实际问题中,不同的数据一般有不同的量纲.为了使有不同量纲的量也能进行比较,通常需要对数据作适当的变换.但是,即使这样,得到的数据也不一定在区间 0,1 上.因此,这里说的数据标准化,就是要根据模糊矩阵的要求,将数据压缩到区间 0,1 上.首先采用标准差标准化变换消除了不同量纲的影响,得到数据标准化矩阵为R,具体标准化方为:

xij

yij j

j

n

,

j

y

i 1

n

ij

n

y

i 1

ij

j

n 1

;

0.5558 0.4495 1.0000 0.8861 1.0000 0.5192 1.0000 0.3805

0.5321 0.3292 0.5567 0.3923 0.3146 1.0000 0.4971 0.3953

0.4204 0 0.1204 0.1536 0.6451 0.0849 0.1225 0.1148

0.0066 0.1588 0.2319 0.7308 0.2880 0.3204 0.1312 0.3819

0.4870 0.4702 0.3128 0.3742 0.4317 0.1913 0.6990 0.1749 0.3827 0.0866 0.0437 0.1187 0.5776 0.0886 0.4359 0.0749 0.3679 0.9719 0.5513 0.9234 0.6430 0.6219 0.8246 0.9620 0.2813 0.7206 0.5990 0.5389 1.0000 0.4343 0.9365 0.8647 0.6958 1.0000 0.2009 0.3363 0.4195 0.4106 0.9625 0.2793 0.2154 0.0646 0.1197 0.1151 0.5155 0.1381 0.2622 0.0388

R

0.3616 0.1710 0.2891 0.4956 0.4158 0.3072 0.2395 0.3027

0.1880 0.6172 0 0.1683 0.2168 0.2806 0.4663 0.1185 0 0.6986 0.0244 0 0 0.2747 0.0071 0 0.1495 0.5131 0.2743 0.2849 0.5629 0.3397 0.2772 0.3529 0.4545 0.3106 0.4103 0.1673 0.3536 0 0.0291 0.1583 1.0000 0.7649 1.0000 0.6107 0.7962 0.5709 0 0.1689 0.2865 0.0415 0.1526 0.2256 0.3696 0.2592 0.2649 0.1561

0.0604 0.2278 0.2998 0.4882 0.1928 0.1353 0.0895 0.1865

0.3087 0.0880 0.1740 0.2040 0.3763 0.2230 0.0278 0.0936 0.3605 0.1156 0.0504 0.2133 0.5216 0.2061 0.0740 0.0603

构造模糊相似矩阵,采用相似系数法中的最大最小法[2]公式来构造矩阵

~

R rij 20 20,其中所用公式为:

rij

x x

k 1k 1m

m

ik

xjk xjk

ik

~

经过计算可得到相似矩阵R,即

1.0000

0.8490 0.6788

0.7918 0.7964

0.6760

0.9480 0.9116

0.7488~ 0.7396R

0.9375 0.7287

0.4157

0.9265 0.6765

0.7680 0.8912

0.8573 0.8366

0.7732

0.84900.67880.79180.79640.6760...0.7732

1.00000.59890.72970.96090.7787...0.6469 0.59891.00000.95620.71540.9128...0.9565

0.72970.95621.00000.80180.9438...0.9493 0.96090.71540.80181.00000.8620...0.7580 0.77870.91280.94380.86201.0000...0.8813

0.93970.59240.70430.88830.6716...0.6806 0.93310.71070.81050.90430.7963...0.7346

0.92540.58400.67980.95490.7713...0.6772 0.74230.93710.98220.82960.9651...0.9205

0.87660.78840.88300.90190.8298...0.8824 0.86910.46420.59120.87410.6742...0.6032

0.41030.04430.12210.43700.1409...0.2581

0.85490.71590.80080.86020.7453...0.7971 0.66190.78380.71380.78480.6893...0.7814

0.67120.74990.74730.78510.6515...0.8226 0.84860.87820.96060.87990.8984...0.9058

0.73150.89990.94690.79330.8341...0.9921 0.67120.91500.92120.76630.8028...0.9630

0.64690.95650.94930.75800.8813...1.0000

3.3 基于模糊聚类方法聚类

由于上述方法构造出的对象与对象之间的模糊关系矩阵R rij

n n

,一般说

来只是一个模糊相似矩阵,而不一定具有传递性,从而未必是模糊等价矩阵.因此,

~

要对被分类对象集U u1,u2,...,u20 进行分类,必须由模糊相似矩阵R出发构造出一个新的模糊等价矩阵,然后以此模糊等价矩阵为基础,进行动态聚类.而相似

~~

矩阵R的传递闭包tR就是一个模糊等价矩阵.

~~2~4~2K

因此,利用平方自乘的方法,即由R R R ... R ...,则一定存

kkkk~~

在一个正整数k,使R2 R2 R2,则此时有R的传递闭包tR R2,计算可得

~

传递闭包为tR,即

1.0000

0.9397 0.9377

0.9377 0.9307

0.9377

0.9480 0.9480

0.9397~ 0.9377tR

0.9480 0.9397

0.7606

0.9480 0.9175

0.9175 0.9377

0.9377 0.9377

0.9377

0.93970.93770.93770.93970.9377...0.9377

1.00000.93770.93770.96090.9377...0.9377 0.93771.00000.95620.93770.9562...0.9565

0.93770.95621.00000.93770.9651...0.9562 0.96090.93770.93771.00000.9377...0.9377 0.93770.95620.96510.93771.0000...0.9562

0.93970.93770.93770.93970.9377...0.9377 0.93970.93770.93770.93970.9377...0.9377

0.95490.93770.93770.95490.9377...0.9377 0.93770.95620.98220.93770.9651...0.9562

0.93970.93770.93770.93970.9377...0.9377 0.95490.93770.93770.95490.9377...0.9377

0.76060.76060.76060.76060.7606...0.7606

0.93970.93770.93770.93970.9377...0.9377 0.91750.91750.91750.91750.9175...0.9175

0.91750.91750.91750.91750.9175...0.9175 0.93770.95620.96060.93770.9606...0.9562

0.93770.94690.94690.93770.9469...0.9469 0.93770.95650.95620.93770.9562...0.9630

0.93770.95650.95620.93770.9562...1.0000

3.4 动态聚类图

λ1

0.98220.96510.96460.9630.96260.96090.96060.95920.95650.95620.95560.95490.9480.94690.94430.93970.93770.91750.7606

1781114259123192041061718151613分类数

2019181716151413121110987654321

3.5 聚类分析结果

~~~

适当选取置信水平值 0,1 ,求出tR的 截矩阵tR ,然后按照tR 进

行分类,具体原则:

~~

rij n n,tR 设tR ~

~1,rij ~~ rij n n,则rij ~,

0,r ij

对于ui,uj U,若~rij 1,则在 水平之上的将对象ui,uj归为同一类.则

~~

选取不同的置信水平值 0,1 ,按 截矩阵tR 进行分类,把tR中的元素按照

从大到小的顺序排列:1 0.9822 0.9651 0.9646 ... 0.7606,有: 当 1时,分类情况为: u1 , u2 ,..., u20 ;

当 0.9822时,分类情况为: u4,u10 , u1 ,..., u20 ; 当 0.9651时,分类情况为: u4,u6,u10 , u1 , u2 ,..., u20 ; ……

当 0.9175时,分类情况为: u13 , u1,u2,...,u20 ; 当 0.7606时,分类情况为: u1,u2,...,u20 . 致谢 衷心感谢杨成福老师的悉心指导!

参 考 文 献

[1] 谢季坚,刘承平著.模糊数学方法及其应用[M].武汉.华中科技大学出版社,2006. [2] 郭嗣琮著.信息科学中的软件计算方法[M].沈阳.东北大学出版社,2001. [3] 陈水利,李敬功,王向公著.模糊集理论及其应用[M].北京.科学出版社,2006.

本文来源:https://www.bwwdw.com/article/3z5q.html

Top