一种改进的层次聚类算法
更新时间:2023-05-30 19:07:02 阅读量: 实用文档 文档下载
- 改进的层次划分?推荐度:
- 相关推荐
针对凝聚式的层次聚类算法在聚类过程中层次化的迭代运算使误差不断累积,导致聚类结果较差的问题,在GN快速算法基础上提出了一种改进的凝聚式层次聚类算法,即网状聚类算法。实验结果表明,该改进算法避免了误差的积累,可以获得更高质量的聚类结果。
第3卷第6 3期 21年 1月 0 2 1
武汉理工大学学报 息与管理工程版信J U N LO T IF R A IN&M N G M N N IE RN ) O R A FWU (N O M TO A A E E TE GN E IG
V 13 . o . 3 No 6 De . 0 1 c 2 1
文章编号:0 7—14 2 1 ) 6— 83—0 10 4 X(0 10 0 8 4
文献标志码: A
一
种改进的层次聚类算法靳延安,刘行军(湖北经济学院信息管理学院,湖北武汉 4 0 0 ) 3 2 5
摘
要:针对凝聚式的层次聚类算法在聚类过程中层次化的迭代运算使误差不断累积,导致聚类结果较差的
问题, G在 N快速算法基础上提出了一种改进的凝聚式层次聚类算法,网状聚类算法。实验结果表明,即该改进算法避免了误差的积累,可以获得更高质量的聚类结果。
关键词:聚类算法;网状聚类;块性函数模中图分类号 ̄P 9 T 31 D I1.9 3 ji n 10 O:0 3 6/.s . 07—14 2 1.6 0 9 s 4 x.0 10 .0
聚类是把各不相同的个体分割为有更多相似性的簇的工作。由聚类所组成的簇是一组数据对象的集合,这些对象与同一簇中的对象彼此类似, 与其他簇中的对象相异…,目前,已有大量的聚类算法。根据数据的类型、目的和应用场景,主要的聚类算法通常分为划分方法 J层次方、法 J基于密度的方法 - 9、于网格的方、 8基 IJ法和基于模型的方法 。其中层次聚类算卜 J法由于其简单,得到了广泛的应用。但该方法经常会遇到合并或分裂点选择的问题。一旦一组对
然后用一个凝聚的层次算法反复地合并子类来找到真正的结果簇。这些算法都需要事先告知簇的
数目,但是簇的数目是十分难以确定的,同时又非常敏感。N WM N提出了一个称为 Nw a E A e m n快速算法的凝聚式聚类算法,该算法最开始用于社会网络图中的社区发现,算法不用事先设定社区的数目,而是通过模块性评价判定最佳聚类效果而停止迭代聚类,所讨论的社区本质上是聚其
类中的簇。该方法具有较好的可伸缩性和较高的效率,同样要遇到合并点选择的困难,但一旦其中的某一步有错误,这种错误将会叠加放大,从而降低聚类的效果。 为了解决上述问题
,者提出了一种改进的笔
象被合并或者分裂,下一步的处理将在新生成的 簇上进行,已做的处理不能被撤销,聚类之间也不能交换对象。若在某一步没有很好地选择合并或分裂,可能导致低质量的聚类结果。为了改进层次聚类算法的质量,内外学者国进行了大量研究 J其中一个很有希望的改进,
N w a快速算法, em n即网状聚类算法( e— gl— nt ag m o e t e l t i grh )并利用该算法在 Is r i u en a otm, av c s r g l i r i数据集上做了测试。实验结果表明,该算法比传统层次聚类算法有更高的准确率。
方向是结合其他聚类技术形成多阶段聚类。LN I. V Y等提出了 BR H算法,算法首先使用 C IC该 F树结构对数据对象进行划分,然后采用其他算法对聚类结果进行求精。该算法具有对数据对象数目的线性伸缩性,并且有较好的聚类质量,但是该算法对于非球形簇效果不是很好。G H U A等采用了随机取样和划分两种方法组合解决了偏好球形和相似大小的问题。K Y I提出了一种基 AR PS等
1基于堆结构的 N w n快速算法 e ma1 1基本思想 .
Nw a e m n快速算法实际上是基于贪婪算法思想的一种凝聚算法。在社会网络图中 (图 1所如示 )每两个有联系的节点都有一条边相连。具,
体思想是:假设起始时刻图中每个节点就是一个
于动态模型的聚类算法,该算法首先通过图划分
社区,依次合并有边相连的社区,并计算合并后的模块性增量。根据贪婪算法的原理,每次合并应
算法将数据对象聚类为大量相对较小的子聚类,
收稿日期: 1— 7一 1 2 1 0 O. 0 作者简介:安(95一,,靳延 17 )男河南郑州人,湖北经济学院信息管理学院博士.
基金项目:省教育科学“湖北十一五”规划科研基金资助项目(00 09; 21B3 )湖北省人文社科基金资助项目(009 ) 2104
正在阅读:
一种改进的层次聚类算法05-30
编一首赞美老师的诗歌03-21
太原市南内环框构桥顶进施工技术06-12
经历的财富作文02-04
公共政策类模拟试题及参考答案04-16
转正定级(单位考核意见)12-23
语文 作业检查情况总结03-14
清教徒10-13
第八讲_图层完全解析08-11
令我感动的一件事作文300字07-15
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 互联网+数据中心行业分析报告
- 2017上海杨浦区高三一模数学试题及答案
- 招商部差旅接待管理制度(4-25)
- 学生游玩安全注意事项
- 学生信息管理系统(文档模板供参考)
- 叉车门架有限元分析及系统设计
- 2014帮助残疾人志愿者服务情况记录
- 叶绿体中色素的提取和分离实验
- 中国食物成分表2020年最新权威完整改进版
- 推动国土资源领域生态文明建设
- 给水管道冲洗和消毒记录
- 计算机软件专业自我评价
- 高中数学必修1-5知识点归纳
- 2018-2022年中国第五代移动通信技术(5G)产业深度分析及发展前景研究报告发展趋势(目录)
- 生产车间巡查制度
- 2018版中国光热发电行业深度研究报告目录
- (通用)2019年中考数学总复习 第一章 第四节 数的开方与二次根式课件
- 2017_2018学年高中语文第二单元第4课说数课件粤教版
- 上市新药Lumateperone(卢美哌隆)合成检索总结报告
- 算法
- 层次
- 改进
- 毕业生就业信息收集与应聘材料准备
- 如何给新生儿起名
- 上海核心购物中心项目考察报告(2014)
- 小波变换在信号处理中的应用
- 骨髓间充质干细胞移植治疗大鼠脑梗死的研究
- 关爱老人家庭公益广告词大全
- 《教育学》辅导11 第十五章 教学组织形式与环节
- 刺梨引种试验初报
- 第三章 食品的热处理和杀菌技术
- 地域特征性的风景园林规划设计分析
- 2工程项目的人力资源管理
- 农药剂型名称及代码
- 26个常见的促销策略
- WINDOWS7出现系统无法启动的修复方法
- 学前教育专业毕业论文选题
- 住房和城乡建设部关于修改《房屋建筑工程和市政基础设施工程竣工验收备案
- XX酒店新员工培训计划书
- 高一记叙文写作序列研究小结
- 浙教版和平小学六年级下册品德与社会期末试卷(二)
- 人教新目标七年级下册Unit 1 第一课时当堂训练(有答案)