模糊聚类分析在我国部分城镇居民消费结构研究中的应用
更新时间:2023-04-23 19:49:01 阅读量: 实用文档 文档下载
模糊聚类分析在我国部分城镇居民消费结构研究中的应用
姜艳 指导老师:杨成福
(河西学院数学与统计学院 甘肃 张掖 734000)
摘 要 随着GDP的稳定高速增长,我国城镇居民的消费水平发生了翻天覆地的变化,家庭各类支出结构的变化充分证明了这个历史性的巨变.在本文中,将通过模糊聚类分析的方法多我国20个城市的居民消费情况进行聚类,并分析现阶段我国城镇居民消费结构所呈现的特点,以促进未来城镇居民消费水平的合理发展及经济稳定增长. 关键词 消费结构;模糊聚类;传递闭包;模糊等价矩阵 中图分类号 O159
1.引言
城镇居民的消费水平不断提高是我国经济稳定快速发展的必要条件,所以我们只有不断促进城镇居民消费水平提高,才能更好地发展经济,提升我国在国际上的地位.而要提高我国城镇居民的消费水平,首先应该做的是了解我国的城镇居民消费结构,只有在了解了城镇居民消费结构的基础上才能对消费水平,及经济上存在的问题予以相应地解决,达到良好的经济发展状态,以此促进我国经济高速稳定的发展.
所谓聚类分析就是根据事物间的不同特征、亲疏程度和相似性等关系,对它们进行分类的一种数学方法,由于在现实生活中,事物间的关系其界限往往是不分明的,即为模糊关系,故利用模糊数学方法进行聚类会显得更自然,更符合客观实际.本文先对给定的样本,根据模糊数学聚类分析理论原则[2]进行最符合实际的分类,而对于待预测样本,可以采用它与已测样本的相似系数最大原则[3],判断其属于哪一个分类,即可得到关于我国部分城市居民消费结构的分类,达到了聚类分析的目的.
2.基于模糊等价关系的聚类分析方法[2] 2.1 模糊等价关系理论 2.1.1 经典等价关系
定义2.1.1[2] 设R是集合U= u1,u2,...,un 上的一个关系,若 ui U都是
uiRui,则称R是自反关系;对于 ui,uj U,如果uiRuj,则必有ujRui,称R是对称关系;对于 ui,uj,uk U,如果uiRuj,且ujRuk,则必有uiRuk,称R是传递关系.满足自反、对称、传递的关系,称为等价关系. 2.1.2 模糊等价关系
由于模糊关系不同于明确关系,任何两个元素之间不能用是、非来判定两者间是否最存在这一关系.因此,需要重新定义模糊关系的自反、对称、传递的关系.
~
设R是U中的模糊关系,若
~
(1) 对于 u U,有 R~ u,u 1,则R是自反的;
~(2) 对于 ui,uj U,有 R~ ui,uj ~ uj,ui ,则R是对称的; R
~(3) 对于 ui,uj,uk U,有 R~ ui,uk ~ ui,uj ~ uj,uk ,则R是传递RR
的.
~
定义2.1.2[2] 若R是满足自反性和传递性的模糊关系,则称R为模糊相容关
系;满足传递性的模糊相容关系称为模糊等价关系,相应的模糊关系矩阵分别称为模糊相容矩阵和模糊等价矩阵.
~~
设R是U上的模糊等价关系,隶属函数为 R~ ui,uj ,R 为R的 截集
0,1 ,R
~ uiuj ,ui,uj U,R是U U的普通子集. ui,uj R
~
定理2.1.2[2] 若R 是U中的模糊等价关系R的 截集,则R 是U中的等价
关系.
2.1.3 模糊关系的传递闭包
~~
定义2.1.3[2] 设R是U中的模糊关系,则U中的模糊关系tR满足:
~
(1)tR
~
t R ; ~~
(2)t R R;
2
~~~~~
(3)设R1是U中的传递关系,且R1 R,必有R1 tR.
~~
则称tR是R的传递闭包.
~~
定理2.1.3[2] 设R Mn n是模糊相容矩阵,则存在一个正整数m n,Rm为
模糊等价矩阵.
~
2.1.3[2]定理说明,对于给定的模糊相容矩阵R,可以用平方自乘方法
~~~~K~~
R R2 R4 ... R2 ...经过有限次合成运算求得tR,且tR是模糊等
价矩阵.
2.2 基于模糊聚类分析在模型中的求解过程 2.2.1 求R的传递闭包
~~
利用上述提及的定理2.1.3[2中的矩阵的自乘方法求得R的传递闭包tR.
2.2.2 聚类原理
~~~
适当选取置信水平值 0,1 ,求出tR的 截矩阵tR ,然后按照tR 进
~~
rij n n,tR行分类,具体原则:设tR ~
~r
ij
n n
~1,rij ~,则rij ~,对于
0,rij
ui,uj U,若~rij 1,则在 水平之上的将对象ui,uj归为同一类.当 在 0,1 中取不同的值时,所分的类也会发生相应的变化.
2.2.3 做动态聚类图
画出相应的动态聚类图是为了更为直观的观察被分类对象的亲疏相关程度,
~
通常将tR中所有互不相同的元素rij按从大到小的顺序进列:1 1 2 ... m,
让 取遍 m,1 上的值,将所分得的一系列类别画到同一个动态图上,即得到动态聚类图.
3.我国城市居民消费结构模型的分析 3.1 分类标准的确定
为研究我国部分城镇居民消费结构,将我国的20个城市U u1,u2,...,u20 ,其中u1,u2,...,u20分别代表:北京、天津、山西、内蒙古、辽宁、黑龙江、上海、浙江、福建、河南、湖南、广西、海南、重庆、云南、西藏、陕西、甘肃、青海、新疆作为研究对象,取定八个研究指标分别为:城市居民消费水平、人均粮食支出(元/人)、人均副食支出(元/人)、人均烟酒、饮料支出、人均其他副食支出、人均衣着支出、人均水电燃料支出、人均其他非商品支出,在这些城市相应指标对应的数据矩阵为:
21.30
21.50 21.84
21.32 22.74
21.33
21.13 19.96
25.56 19.07U
20.25 18.70
16.16
18.18 22.30
29.67 20.03
18.68 20.33
21.03
124.89122.3966.3867.08115.8875.50168.69142.24171.6573.18104.45131.35139.92120.3999.08146.9070.7572.7475.6478.55
35.4329.0818.0520.2828.2114.0040.8143.3322.3018.0120.7211.6912.9826.1833.3664.5119.7523.7220.8814.35
73.9851.6431.3235.2742.4429.5670.1250.7440.5329.3838.1532.0623.5837.9432.0154.3634.9538.6933.8634.33
93.0155.0474.4881.0758.0769.2974.32101.7757.1364.5162.9841.5424.8768.1652.0686.1053.2962.4153.8164.98
20.5811.308.1910.949.638.2415.4612.9212.608.9112.6710.8410.7611.647.0414.7710.559.6510.069.83
43.9754.8834.9739.4648.6542.0850.9053.4454.0338.1439.1642.7732.3538.4832.8532.1938.2035.2632.8233.87
433.73
288.13 177.45
182.20 194.85 165.90
422.74 394.55
225.08 155.45
213.56 178.51
144.21
246.37 190.04
193.10 189.41
170.12 171.32
161.67
3.2 数据标准化构造相似矩阵
在实际问题中,不同的数据一般有不同的量纲.为了使有不同量纲的量也能进行比较,通常需要对数据作适当的变换.但是,即使这样,得到的数据也不一定在区间 0,1 上.因此,这里说的数据标准化,就是要根据模糊矩阵的要求,将数据压缩到区间 0,1 上.首先采用标准差标准化变换消除了不同量纲的影响,得到数据标准化矩阵为R,具体标准化方为:
xij
yij j
j
n
,
j
y
i 1
n
ij
n
y
i 1
ij
j
n 1
;
0.5558 0.4495 1.0000 0.8861 1.0000 0.5192 1.0000 0.3805
0.5321 0.3292 0.5567 0.3923 0.3146 1.0000 0.4971 0.3953
0.4204 0 0.1204 0.1536 0.6451 0.0849 0.1225 0.1148
0.0066 0.1588 0.2319 0.7308 0.2880 0.3204 0.1312 0.3819
0.4870 0.4702 0.3128 0.3742 0.4317 0.1913 0.6990 0.1749 0.3827 0.0866 0.0437 0.1187 0.5776 0.0886 0.4359 0.0749 0.3679 0.9719 0.5513 0.9234 0.6430 0.6219 0.8246 0.9620 0.2813 0.7206 0.5990 0.5389 1.0000 0.4343 0.9365 0.8647 0.6958 1.0000 0.2009 0.3363 0.4195 0.4106 0.9625 0.2793 0.2154 0.0646 0.1197 0.1151 0.5155 0.1381 0.2622 0.0388
R
0.3616 0.1710 0.2891 0.4956 0.4158 0.3072 0.2395 0.3027
0.1880 0.6172 0 0.1683 0.2168 0.2806 0.4663 0.1185 0 0.6986 0.0244 0 0 0.2747 0.0071 0 0.1495 0.5131 0.2743 0.2849 0.5629 0.3397 0.2772 0.3529 0.4545 0.3106 0.4103 0.1673 0.3536 0 0.0291 0.1583 1.0000 0.7649 1.0000 0.6107 0.7962 0.5709 0 0.1689 0.2865 0.0415 0.1526 0.2256 0.3696 0.2592 0.2649 0.1561
0.0604 0.2278 0.2998 0.4882 0.1928 0.1353 0.0895 0.1865
0.3087 0.0880 0.1740 0.2040 0.3763 0.2230 0.0278 0.0936 0.3605 0.1156 0.0504 0.2133 0.5216 0.2061 0.0740 0.0603
构造模糊相似矩阵,采用相似系数法中的最大最小法[2]公式来构造矩阵
~
R rij 20 20,其中所用公式为:
rij
x x
k 1k 1m
m
ik
xjk xjk
ik
~
经过计算可得到相似矩阵R,即
1.0000
0.8490 0.6788
0.7918 0.7964
0.6760
0.9480 0.9116
0.7488~ 0.7396R
0.9375 0.7287
0.4157
0.9265 0.6765
0.7680 0.8912
0.8573 0.8366
0.7732
0.84900.67880.79180.79640.6760...0.7732
1.00000.59890.72970.96090.7787...0.6469 0.59891.00000.95620.71540.9128...0.9565
0.72970.95621.00000.80180.9438...0.9493 0.96090.71540.80181.00000.8620...0.7580 0.77870.91280.94380.86201.0000...0.8813
0.93970.59240.70430.88830.6716...0.6806 0.93310.71070.81050.90430.7963...0.7346
0.92540.58400.67980.95490.7713...0.6772 0.74230.93710.98220.82960.9651...0.9205
0.87660.78840.88300.90190.8298...0.8824 0.86910.46420.59120.87410.6742...0.6032
0.41030.04430.12210.43700.1409...0.2581
0.85490.71590.80080.86020.7453...0.7971 0.66190.78380.71380.78480.6893...0.7814
0.67120.74990.74730.78510.6515...0.8226 0.84860.87820.96060.87990.8984...0.9058
0.73150.89990.94690.79330.8341...0.9921 0.67120.91500.92120.76630.8028...0.9630
0.64690.95650.94930.75800.8813...1.0000
3.3 基于模糊聚类方法聚类
由于上述方法构造出的对象与对象之间的模糊关系矩阵R rij
n n
,一般说
来只是一个模糊相似矩阵,而不一定具有传递性,从而未必是模糊等价矩阵.因此,
~
要对被分类对象集U u1,u2,...,u20 进行分类,必须由模糊相似矩阵R出发构造出一个新的模糊等价矩阵,然后以此模糊等价矩阵为基础,进行动态聚类.而相似
~~
矩阵R的传递闭包tR就是一个模糊等价矩阵.
~~2~4~2K
因此,利用平方自乘的方法,即由R R R ... R ...,则一定存
kkkk~~
在一个正整数k,使R2 R2 R2,则此时有R的传递闭包tR R2,计算可得
~
传递闭包为tR,即
1.0000
0.9397 0.9377
0.9377 0.9307
0.9377
0.9480 0.9480
0.9397~ 0.9377tR
0.9480 0.9397
0.7606
0.9480 0.9175
0.9175 0.9377
0.9377 0.9377
0.9377
0.93970.93770.93770.93970.9377...0.9377
1.00000.93770.93770.96090.9377...0.9377 0.93771.00000.95620.93770.9562...0.9565
0.93770.95621.00000.93770.9651...0.9562 0.96090.93770.93771.00000.9377...0.9377 0.93770.95620.96510.93771.0000...0.9562
0.93970.93770.93770.93970.9377...0.9377 0.93970.93770.93770.93970.9377...0.9377
0.95490.93770.93770.95490.9377...0.9377 0.93770.95620.98220.93770.9651...0.9562
0.93970.93770.93770.93970.9377...0.9377 0.95490.93770.93770.95490.9377...0.9377
0.76060.76060.76060.76060.7606...0.7606
0.93970.93770.93770.93970.9377...0.9377 0.91750.91750.91750.91750.9175...0.9175
0.91750.91750.91750.91750.9175...0.9175 0.93770.95620.96060.93770.9606...0.9562
0.93770.94690.94690.93770.9469...0.9469 0.93770.95650.95620.93770.9562...0.9630
0.93770.95650.95620.93770.9562...1.0000
3.4 动态聚类图
λ1
0.98220.96510.96460.9630.96260.96090.96060.95920.95650.95620.95560.95490.9480.94690.94430.93970.93770.91750.7606
1781114259123192041061718151613分类数
2019181716151413121110987654321
3.5 聚类分析结果
~~~
适当选取置信水平值 0,1 ,求出tR的 截矩阵tR ,然后按照tR 进
行分类,具体原则:
~~
rij n n,tR 设tR ~
~1,rij ~~ rij n n,则rij ~,
0,r ij
对于ui,uj U,若~rij 1,则在 水平之上的将对象ui,uj归为同一类.则
~~
选取不同的置信水平值 0,1 ,按 截矩阵tR 进行分类,把tR中的元素按照
从大到小的顺序排列:1 0.9822 0.9651 0.9646 ... 0.7606,有: 当 1时,分类情况为: u1 , u2 ,..., u20 ;
当 0.9822时,分类情况为: u4,u10 , u1 ,..., u20 ; 当 0.9651时,分类情况为: u4,u6,u10 , u1 , u2 ,..., u20 ; ……
当 0.9175时,分类情况为: u13 , u1,u2,...,u20 ; 当 0.7606时,分类情况为: u1,u2,...,u20 . 致谢 衷心感谢杨成福老师的悉心指导!
参 考 文 献
[1] 谢季坚,刘承平著.模糊数学方法及其应用[M].武汉.华中科技大学出版社,2006. [2] 郭嗣琮著.信息科学中的软件计算方法[M].沈阳.东北大学出版社,2001. [3] 陈水利,李敬功,王向公著.模糊集理论及其应用[M].北京.科学出版社,2006.
正在阅读:
模糊聚类分析在我国部分城镇居民消费结构研究中的应用04-23
严新气功修炼语录06-01
Gullivers Travels英文读书笔记(标准格式)06-12
我也在找CAD多点命令05-31
统计学课程设计06-06
八年级地理上册第14周周考试卷06-08
进出口报关贸易方式代码及说明 - 图文03-19
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 互联网+数据中心行业分析报告
- 2017上海杨浦区高三一模数学试题及答案
- 招商部差旅接待管理制度(4-25)
- 学生游玩安全注意事项
- 学生信息管理系统(文档模板供参考)
- 叉车门架有限元分析及系统设计
- 2014帮助残疾人志愿者服务情况记录
- 叶绿体中色素的提取和分离实验
- 中国食物成分表2020年最新权威完整改进版
- 推动国土资源领域生态文明建设
- 给水管道冲洗和消毒记录
- 计算机软件专业自我评价
- 高中数学必修1-5知识点归纳
- 2018-2022年中国第五代移动通信技术(5G)产业深度分析及发展前景研究报告发展趋势(目录)
- 生产车间巡查制度
- 2018版中国光热发电行业深度研究报告目录
- (通用)2019年中考数学总复习 第一章 第四节 数的开方与二次根式课件
- 2017_2018学年高中语文第二单元第4课说数课件粤教版
- 上市新药Lumateperone(卢美哌隆)合成检索总结报告
- 城镇
- 模糊
- 居民
- 结构
- 部分
- 我国
- 消费
- 应用
- 分析
- 研究
- 小组合作学习管理办法及奖惩方案
- 2006年高考英语试卷(陕西)
- “十二五”能源规划前期重大问题研究招标
- 冰淇淋生产中的稳定剂、乳化剂及复合乳化稳定剂
- 2011年5月 物流师 基础知识真题
- Firs Confession1 读后感
- 99S304卫生设备安装图集
- 风力发电行业调查数据分析报告2022版
- 三氟甲基吡啶衍生物类农药综述_邓红霞
- 有肩就的挑担子 课件
- 沙河源小学校庆庆典文艺汇演主持词
- 8-佛山市顺德区教育局教研室
- 第三章 材料成形热过程(南理工材料学院复试科目)
- 农药学基础 6-2 杀菌剂
- “放羊式教学”之我见
- 西南交1112考试批次《画法几何及工程制图》复习题及参考答案
- C语言课程设计___建筑工地信息管理系统
- 新规范脚手架课件讲解
- 标准化知识试卷 1 答案
- 2011年安徽省中考数学试题及答案(word)