数据挖掘实验报告二

更新时间:2024-06-11 21:51:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

Southwest university of science and technology

数据挖掘课程报告

使用数据挖掘工具进行决策树分析

学院名称 专业名称 学生姓名 学

计算机科学与技术学院 计算机科学与技术

指导教师

吴珏

2016年十一月

实验二

一.实验目的

掌握CART决策树构建分类模型。

二.实验内容

对所有窃漏电用户及真诚用户的电量、告警及线损数据和该用户在当天是否窃漏电的标识,按窃漏电评价指标进行处理并选取其中291个样本数据,得到专家样本,使用CART决策树实现分类预测模型。

注意:数据的80%作为训练样本,剩下的20%作为测试样本

三.实验步骤

1、 对数据进行预处理 打开D:/dmex/ex2/ex2/上机实验/data/model的excel文件 如图

2、 把数据随机分为两部分,一部分用于训练,一部分用于测试。

打开d:/dmex/ex2/ex2/上机实验/code/ split_data文件 如图所示

分成testData和trainData文件 即测试数据和训练数据

3、 使用tree包里的tree函数以及训练数据构建CART决策树模型,使用predict函数

和构建的CART决策树模型分别对训练数据和测试数据进行分类。 打开D:/dmex/ex2/ex2/code/ construct_tree_model.R上机实验结果如图所示

结果如图所示:

4、 使用nnet包里面的nnet函数以及训练数据构建神经网络模型,使用predict函数和

构建的神经网络模型分别对训练数据和测试数据进行分类。 打开D:/dmex/ex2/ex2/code/construct_nnet_model.R文件如下图所示

实验结果如图所示:

五.实验结果

六.思考与分析

1、尝试采用神经网络对数据进行分类,并与CART决策树的结果进行比较。

答:与神经网络相比,决策树可以很好地处理非数值型的数据,但是决策树对连续的数

据(比如连续的数值型数据)不太擅长。

本文来源:https://www.bwwdw.com/article/76r6.html

Top