基于R语言多种聚类算法演示平台 - 图文
更新时间:2023-10-24 12:01:01 阅读量: 综合文库 文档下载
本科毕业设计论文
题目:基于R语言的多种聚类算法演示平台开发
作者姓名 徐天宇 指导教师 陈晋音教授 专业班级 自动化1104 学 院 信息工程学院
提交日期 2015年5月28日
浙江工业大学本科毕业设计论文
基于R语言的多种聚类算法演示平台开发
作者姓名:徐天宇 指导教师:陈晋音副教授
浙江工业大学信息工程学院
2015年6月
Dissertation Submitted to Zhejiang University of Technology
for the Degree of Bachelor
Clustering Algorithms Demonstration Platform based
on Rstudio
Student: Tianyu Xu Advisor: Jinyin Chen
College of Information Engineering Zhejiang University of Technology
June 2015
浙 江 工 业 大 学
本科生毕业设计(论文、创作)任务书
专 业____自动化____ 班 级____1104____ 学生姓名/学号 徐天宇/201103120423__
一、设计(论文、创作)题目: 基于R语言的多种聚类算法演示平台 二、主要任务与目标: 基于R语言平台实现多种聚类算法,包括基于划分的聚类算法kmeans
等,基于密度的聚类算法DBSCAN等,并设计实现各种算法的演示平台,可视化界面调用各个测试数据集,完成聚类并利用图和表等形式演示聚类效果。
三、主要内容与基本要求:
主要内容:(1)分析现有聚类算法的分类及其代表算法,及其解决的关键问题分析;(2)基于R语言的各种聚类算法的实现和性能演示;(3)实验验证模型及粒子群优化算法的有效性。 基本要求:(1)分析现有聚类算法及其优缺点;(2)自主设计基于R语言的各种聚类算法实现和调试;(3)编写程序实现交互式演示平台,完成各种聚类算法的性能比较和演示;(4)仿真实验利用
UCI数据集验证平台对各个聚类算法的演示和效率评价。
四、计划进度:
(1)2014年12月至2015年2月:完成文献调研、综述撰写和2篇外文文献翻译;(2)2015年3月:基于R语言的聚类算法开发和设计;(3)2015年4月:编程实现前台可视化交互演示平台,并演示聚类算法的效率评价;(4)2015年5月:完成实验总结并撰写毕业论文,准备答辩。
五、主要参考文献:
[1]Zhu Qun, Zhang Yu-Hong, Hu Xue-Gang, Li Pei-Pei. A double-window-based classification algorithm for concept drifting data streams [J]. Acta Automatica Sinica, 2011, 37(9):1077-1084 [2]Hassani M, Spaus P, Gaber M M, Seidl T. Density-based projected clustering of data streams [J]. In: Proceeding of the 2012 Scalable Uncertainty management, Berlin Heidelberg, Springer, 2012 311-324. [3] Huang D C, Shen X Q, Lu Y H. Double k-nearest Neighbors of Heterogeneous Data Stream Clustering Algorithm [J]. Journal of Computer Science and Technology, 2013, 40(10):226-230. [4] Yang C Y, Zhou J. A heterogeneous data stream clustering algorithm [J]. Chinese J of Computers, 2007, 30(8):1364-1371. [5] Aggarwal C C, Yu P S. A framework for clustering massive text and categorical data streams [J]. In: Proceeding of the 6th SIAM International Conference on Data Mining. Bethesda, 2006: 477-481.
任务书下发日期 2014 年 12 月 26 日
设计(论文、创作)工作自 2015 年12月 26日 至 2015年 6 月 8 日
设计(论文、创作)指导教师
学科(方向)负责人
主管院长
基于R语言的多种聚类算法演示平台开发
摘 要
聚类分析是模式识别、数据挖掘、机器学习中的很重要的一类方法,它是将数据集按照某种指导思想划分成一些簇的过程。由于聚类问题的重要性,近50年提出了各种各样的算法,又因为聚类问题属于一个病态问题,聚类算法的效果和实际数据对象有很大的相关性,目前还没有一个算法可以很好的解决所有的聚类问题,不同的算法有各自不同的优缺点。为了新算法的开发需要,以及为了解决特定聚类问题的需要,开发一个包含多种聚类算法的可演示可扩展的平台将非常有价值,本文利用R语言实现了包含6个典型聚类算法和7个典型数据集的聚类算法演示平台,主要工作如下:
(1)为了类比不同类型的聚类算法性能,本文实现了基于划分的k-means、AP算法、基于密度的DBSCAN,和基于层次的AGNES、基于粒子群的聚类算法以及先进的FDP算法。
(2)利用Rstudio公司开发的shiny包实现交互式演示平台,实现良好用户交互性,并对以上6种典型聚类算法和7个典型数据集展开聚类演示,动态比较聚类过程,并分析性能优劣。
(3)基于实现的聚类算法和演示平台,本文实现了基于聚类分析的NBA篮球运动员类型分类和球队球员结构分类的应用,验证了所实现聚类算法的有效性。
关键词:聚类算法,演示平台, Rstudio, NBA球员聚类
I
正在阅读:
基于R语言多种聚类算法演示平台 - 图文10-24
第五章习题12-20
张京祥:新型城镇化的关键驱动是制度创新06-28
2015-2016学年度最新人教版四年级数学上册第八九单元学案06-28
国务院令第608号文-退役士兵安置条例12-24
我向往的一所学校作文600字07-11
读后感小学生作文600字06-15
禹州市房地产市场调研报告06-20
渔父公开课教案03-01
从业人员健康管理制度和培训管理制度07-25
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 算法
- 演示
- 多种
- 基于
- 语言
- 图文
- 平台
- 三相交流系统短路电流计算 - 图文
- 醴陵历史文化地理 - 图文
- 小学语文教育科研
- 个人先进事迹材料
- 设计色彩 课程标准 新媒体
- 电子政务总结要点步骤 - 图文
- 印发广东省海洋经济发展“十二五”规划的通知
- 文献检索学习心得体会
- 590107-计算机网络系统管理专业教学基本要求-人才培养方案 - 图文
- 九下健康教育教案
- 全科医学概论复习
- 户外活动教研计划
- 2019高中英语 Unit 9 Wheels英美文化欣赏学案 北师大版必修3
- 让初中数学课堂充满活力
- 行车荷载 - 图文
- 食品厂质量手册
- 2014年中级财务管理(word版)模拟试题01
- 最新工程力学与航天航空工程专业毕业自我个人小结优秀范文原创
- 钛酸锂材料的结构特点
- 推荐下载 办公室交流发言材料 镇党政办公室经验交流发言材料-最新