一种改进的C4.5算法及在贫困生认定中的应用

更新时间:2024-03-05 22:01:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

一种改进的C4.5算法及在贫困生认定中的应用

摘要:考虑到c4.5算法存在的信息增益率计算繁琐问题,提出了一种适合贫困生评定的复杂应用的改进c4.5决策树算法。在c4.5算法的基本原理的基础上,引用taylor公式简化计算过程,降低了信息增益率的计算量,提高了算法分类速度。详细分析了贫困生认定工作流程,抽取相关信息,运用本文算法分析实验结果表明,该算法在指导高校贫困生认定实际工作中取得显着效果。 关键词:贫困生认定;c4.5算法;taylor公式

中图分类号:tp311.5 文献标识码:a 文章编号:1007-9599 (2013) 02-0000-04 1 引言

数据挖掘就是近年来比较热的研究领域,简单来说,数据挖掘就是从大量数据中高效地抽取有用信息的过程[1,2]。在数据挖掘技术中,应用最广的分类技术可以说是决策树算法,它是通过决策树归纳学习产生规则,从规则中抽取知识。经过国内外研究者的不懈努力,目前存在很多构造决策树的方法,其中最具有影响力的是众所周知的id3算法[3],其核心思想是用信息增益作为选择属性的标准,并且是在决策树上的各个结点上进行测验。随后,id3的改进版c4.5算法[4]被提出,它则是计算每个属性的信息增益率,然后选择具有最大信息增益率的属性作为节点属性。但是在信息增益率的计算过程中,无疑会涉及到复杂函数和库函数,所以会延长

本文来源:https://www.bwwdw.com/article/j8wa.html

Top