C5.0算法实验报告模版
更新时间:2023-10-16 14:40:01 阅读量: 综合文库 文档下载
- C5.0算法推荐度:
- 相关推荐
湖南工程学院 数据挖掘 实验报告
专业班级 统计学1101 姓名 组别 同组实验人员 无 实验日期 实验名称 实验目的 实验步骤: 2014年11月05日 C5.0算法及应用 掌握C5.0算法的原理及应用 指导老师 刘劲光 评分 第一步:处理数据,由于数据存在在分开的两页表格中,利用append节点将两张表结合起来。 第二步:C5.0基本应用 1、由上面的结果可接入C5,0节点进行分析,接入节点后,如图:
利用C5.0模型对已预处理过的数据进行分析,具体结果如下图 从上图可以看出这是一颗两层决策树,第一层考把家长是否鼓励看做一个最佳分组变量,由此形成二叉树。家长不鼓励节点中有30个样本,则其中不参加的有28人,占93.3%,所以按众数类别,预测为不走读。家长鼓励(39个样本),且在校综合评价指数小于等于48分的(15个样本),不参加社会公益活动,置信度为80%;家长鼓励,切在校综合评价大于48分(24个样本),参加社会公益活动,置信度为83%。 总之家长是否鼓励是决定学生是否参加公益活动的关键因素,其次是学生的在校综合评价指数。 2、预测结果 为观测C5.0对每个样本的预测结果,可在流管理器的Models卡中,鼠标右击C5.0模型结果,选择弹出菜单中的Add To Stream,并将模型结果连到数据流中,然后连接Table节点查看预测结果。如下图:
第三步:C5.0的损失矩阵 损失矩阵,Cost选项卡设置损失矩阵,选中Use misclassification costs选项。 第四步:分类回归树的基本应用 以电信客户数据为例,讨论分类回归树的具体操作。首先,在数据流中添加Partition节点,将样本集划分为训练样本集和检验样本集;然后,选择Modeling卡中C&RT节点并将其连接到数据流恰当位置,右击鼠标,选择弹出菜单中的Edit选项进行参数设置。
由下图可以看到,性别和居住地对客户流失的影响不大,其他因素都有影响。 重新设置参数,选中Use Standard error rule选项并在Multiple框指定参数m为1.5。此时,年龄、收入、教育水平、开通月数等为导致流失的重要因素。 指导教师评语: 签字: 年 月 日
正在阅读:
C5.0算法实验报告模版10-16
单片机原理复习题12-05
北师大版八下数学第二章 一元一次不等式与一元一次不等式组第5节04-06
2010年国考行测真题 答案与解析04-14
房屋建筑学习题集03-30
中国近现代史纲要实践教学大纲05-27
高原现代生态新牧区的思考03-26
和谐型电力机车检修基地检修工艺布局的研究07-23
2015年会计继续教育之行政单位会计制度06-07
初中物理概念总复习精要提纲09-28
- 必修一物理寒假作业
- 2019-201X年5月大学生入党积极分子思想汇报-word范文模板(3页)
- 药物分析习题五
- 重拾应用意识 体会数学价值(沈建军)
- 2017全国高校辅导员结构化面试题集及参考答案
- 广东徐闻县实验中学2014届高三第二次月测地理试题
- 今天你共鸣了么?
- 2018-2019正能量读后感1000字-推荐word版(6页)
- 2018年中国截切型盖板针布行业专题研究分析报告目录
- 中国移动业务处理流程大全
- 公文写作常用词汇和句子集锦2016
- ARM课程设计说明书
- 教师资格证教育学论文
- 中考试卷分析
- 环境监测试卷(五)
- 党风廉政建设广播稿1
- 快速制作香香宫煮麻辣烫教程
- 《国际金融学》习题
- 文明施工保障措施方案
- 春兰维修资料故障代码
- 算法
- 模版
- 实验
- 报告
- 5.0
- 第三届浙江省青少年科普征文大赛
- (最新版)翻译毕业论文开题报告 - 图文
- 学前卫生学复习资料
- 国际金融期末试题(判断选择多选大全含答案)1
- 小学四年级趣味数学之简便计算口诀+练习
- 2018届海淀区高三第二学期化学期末练习(二模)
- 景观施工图设计规范正文
- 网络传播概论
- 测量小灯泡的电功率教学反思篇一
- 物料需求计划与企业资源计划
- 中医学问答题
- 包装印刷企业市场营销策略现状及改进 - 以A企业为例的分析-毕业论文
- 9E燃机系统说明
- 2016-2017年监理工程师继续教育市政公用考试及答案
- 第二十二章 ds 区元素试题及答案
- 基于核心素养的思想政治课教学探析
- 音乐的定义
- 省委书记在五四青年节座谈会讲话稿
- 2018年高校教师资格证高等教育政策及法规整理
- 2012年11月助理人力资源管理师(三级)考试题及答案