Weka C4.5算法使用例子 鸢尾花数据

更新时间:2023-11-22 08:12:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

数据源:iris.arff

决策树:C4.5算法的Java实现,J48 NAME

weka.classifiers.trees.J48

SYNOPSIS

Class for generating a pruned or unpruned C4.5 decision tree. For more information, see

Ross Quinlan (1993). C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers, San Mateo, CA.

OPTIONS

binarySplits -- Whether to use binary splits on nominal attributes when building the trees. 二进制分裂:是否使用二进制分裂名词性属性;默认False

confidenceFactor -- The confidence factor used for pruning (smaller values incur more pruning). 置信因子:用于修剪的置信因子(小于该值导致修剪);默认0.25

debug -- If set to true, classifier may output additional info to the console. 测试:设置为true,则分类器可能在控制台输出另外的信息;默认False minNumObj -- The minimum number of instances per leaf. 最小实例数量:每个叶的最小实例数量;默认2

numFolds -- Determines the amount of data used for reduced-error pruning. One fold is used for pruning, the rest for growing the tree. 折数:决定用于reduced-error(减少-误差)修剪的数据量;一折用于修剪,另外的用于建树;默认3

reducedErrorPruning -- Whether reduced-error pruning is used instead of C.4.5 pruning. 减少-误差修剪:是否使用减少-误差修剪,而不是C4.5修剪;默认:False saveInstanceData -- Whether to save the training data for visualization. 保存实例数据:是否为了展示保存训练数据;,默认:False

seed -- The seed used for randomizing the data when reduced-error pruning is used. 种子:减少-误差修剪时,用于随机化数据的种子;默认:1

subtreeRaising -- Whether to consider the subtree raising operation when pruning. 子树上升:修剪树的时候是否考虑子树上升操作;默认:True unpruned -- Whether pruning is performed. 不修剪:修剪是否需要;默认:False

useLaplace -- Whether counts at leaves are smoothed based on Laplace. 使用拉普拉斯:是否叶节点基于拉普拉斯平滑;默认:False

修剪的方式:存在C.4.5修剪,和减少-误差修剪;reducedErrorPruning控制,默认是C.4.5修剪;

是否修剪:unpruned控制,默认是修剪;

使用系统默认:J48 –C 0.25 –M 2 -C 置信因子

-M 最小实例数量 使用C.4.5修剪 决策树如下:

错误率:4%;

使用减少-误差修剪:J48 –R –N 3 –Q 1 –M 2 -R:

-N: numFolds -Q:seed

-M:minNumObj 决策树如下:

错误率:5.3%

本文来源:https://www.bwwdw.com/article/00pv.html

Top