数据挖掘实验报告 - 图文

更新时间:2023-11-18 06:22:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

学生学号 0120903490205 实验课成绩 学 生 实 验 报 告 书

实验课程名称 开 课 学 院 指导教师姓名 学 生 姓 名

数据挖掘与知识管理

管理学院 宋华 李亚军

学生专业班级 信息管理与信息系统0902班

2011 —2012 学年 第 二 学期

实验报告填写规范

1、 实验是培养学生动手能力、分析解决问题能力的重要环节;实验报告是反映实验教学水

平与质量的重要依据。为加强实验过程管理,改革实验成绩考核方法,改善实验教学效果,提高学生质量,特制定本实验报告书写规范。 2、 本规范适用于管理学院实验课程。

3、 每门实验课程一般会包括许多实验项目,除非常简单的验证演示性实验项目可以不写实

验报告外,其他实验项目均应按本格式完成实验报告。在课程全部实验项目完成后,应按学生姓名将各实验项目实验报告装订成册,构成该实验课程总报告,并给出实验课程成绩。

4、 学生必须依据实验指导书或老师的指导,提前预习实验目的、实验基本原理及方法,了

解实验内容及方法,在完成以上实验预习的前提下进行实验。教师将在实验过程中抽查学生预习情况。

5、 学生应在做完实验后三天内完成实验报告,交指导教师评阅。

6、 教师应及时评阅学生的实验报告并给出各实验项目成绩,同时要认真完整保存实验报

告。在完成所有实验项目后,教师应将批改好的各项目实验报告汇总、装订,交课程承担单位(实验中心或实验室)保管存档。 附表:实验成绩考核建议

观测点 考核目标 成绩组成 实验预习 实验过程 结果分析 1. 对验证型实验,考察对实验原理与方法的对实验目的和基本原理预习情况 的认识程度,对实验方2. 对于综合型、设计型实验,着重考查设案的设计能力 计方案的科学性、可行性和创新性 1. 是否按时参加实验 2. 对实验过程的熟悉程度 着重考查学生的实验态3. 对基本操作的规范程度 度、基本操作技能;严4. 对突发事件的应急处理能力 谨的治学态度、团结协5. 实验原始记录的完整程度 作精神 6. 同学之间的团结协作精神 1. 所分析结果是否用原始记录数据 考查学生对实验数据处2. 计算结果是否正确 理和现象分析的能力;3. 实验结果分析是否合理 对专业知识的综合应用4. 对于综合实验,各项内容之间是否有分能力;事实求实的精神 析、比较与判断等 20% 30% 50%

实验项目名称 数据预处理 实验者 同组者 李亚军 无 专业班级 信息管理与信息系统0902班 实验日期 2012-3-9 1.实验目的与意义 1)、分析计算数据整体状况,画出直方图 2)、熟悉TIPDM软件功能和操作特点 3)、了解TIPDM软件的各选项面板和操作方法。 4)、熟练掌握TIPDM软件工作流程。 5)、利用TIPDM进行数据预处理操作(操作最大列数25,文件最大1M) 2.基本原理和方法 遵循计算机操作的基本原理和方法。 3.主要仪器设备及耗材 实验所用的主要仪器设备: 计算机(安装Excel与TipDM软件) 实验所需主要耗材的品种及数量: 无 4.实验方案或技术路线 1)上网查询,了解本实验要求的内容,撰写相关报告。 2)任务一:独立完成数据探索,获取描述值(最大、最小值、均值、方差)并绘制直方图; 3)任务二、熟悉数据挖掘软件TIPDM流程 4)任务三:利用主成分分析法进行降维处理及数据相关性分析 (xg090101,xg90201,xg90301) 5.实验内容及步骤 1、利用Excel探索数据,计算数据个数、极值、平均值、标准差,并绘制直方图。 1) 使用原数据参考文件实验1-1.xls 2) 需要统计的数据如下: 规格 数据统计 直方图 规格中心 规格上限 规格下限 数据个数 最大值 最小值 平均值 最大值 最小值 区间 直方图柱数 标准偏差 直方图组距 说明:每个字段如何得到。 规格-规格中心:这个是根据产品规格或者所要统计数据的理论值的平均值,与原数据无关,如果制作与原数据相关的直方图,那么这个就是需要的。一般是自己统计原数据的平均值,最大值,最小值来做直方图。所以规格中心、规格上限、规格下限得看要求作出哪种直方图来定,要是使用规格值,那么最大值,最小值,平均值就可以不必统计。我们这里使用原数据统计的平均值、最大值、最小值来做。 规格-规格上限:同上解释 规格-规格下限:同上解释 数据统计-数据个数:统计放在A列中的数值到底有多少个,使用公式=counta(A:A)[红色的是你的数据列,你可以根据自己存放数据的不同而去更改他] 数据统计-最大值:统计数据的最大值,使用公式 =MAX(A:A)[红色的是你的数据列,你可以根据自己存放数据的不同而去更改他] 数据统计-最小值:统计数据的最小值,使用公式 =MIN(A:A)[红色的是你的数据列,你可以根据自己存放数据的不同而去更改他] 数据统计-平均值:数据的平均值,使用公式 =AVERAGE(A:A)[红色的是你的数据列,你可以根据自己存放数据的不同而去更改他] 数据统计-标准偏差:统计数据的标准偏差,使用公式 =STDEV(A:A)[红色的是你的数据列,你可以根据自己存放数据的不同而去更改他] 直方图-最大值:直方图中的数值都使用整数(直方图-组距除外)。一般是使用规格-规格上限与数据统计-最大值中的最大值,这里直接使用数据统计-最大值即可。使用公式 = D4[红色的是根据自己存放数据的不同而去更改他] 直方图-最小值:同上,使用数据统计-最小值。使用公式 =D5[红色的是根据自己存放数据的不同而去更改他] 直方图-区间:使用直方图-最大值-直方图-最小值。使用公式 =G2-G3 [红色的是根据自己存放数据的不同而去更改他] 直方图-直方图柱数:直方图柱数就是咱们要制作直方图的柱体的数量,在excel中就是图形中长方柱的个数。一般等于数据统计-数据个数开方再加上1.。使用公式=SQRT(D2)+1[红色的是根据自己存放数据的不同而去更改他] 直方图-直方图组距:组距就是excel直方图中每个柱体之间相距多少,一般是使用直方图-区间除以直方图-柱数。使用公式 = =G4/(G5-1)[这里还需要减1是因为我们在计算直方图-直方图柱数的时候加了1.红色的是根据自己存放数据的不同而去更改他] 完成统计的结果如下所示: B列 C列 E列 前面单元格使用公式1行 数据统计 为 2行 数据个数 300 =COUNT(A:A) 3行 最大值 57.90 =MAX(A:A) 4行 最小值 50.60 =MIN(A:A) 5行 平均值 54.10 =AVERAGE(A:A) 6行 标准偏差 1.15 =STDEV(A:A) D列 F列 直方图 G列 I列 前面单元格使用为 58 =D3 51 =D4 7 =G2-G3 最大值 最小值 区间 直方图柱 18 =SQRT(D2)+1 数 直方图组 0.42 =G4/(G5-1) 距 3) 计算平均分开组距、计算绘制直方图需要的频数。 分组数据:分组数据就是excel直方图中的分组区间,一般就是最小值加上组距,计算出共有18组,在分组数据中输入如下公式: 10行 11行 12行 13行 14行 15行 16行 17行 18行 19行 20行 21行 C列 1 2 3 4 5 6 7 8 9 10 D列 分组数据 =G3 =D12+$G$6 =D13+$G$6 =D14+$G$6 =D15+$G$6 =D16+$G$6 =D17+$G$6 =D18+$G$6 =D19+$G$6 =D20+$G$6 E列 直方图 =FREQUENCY(A:A,D12:D29)

本文来源:https://www.bwwdw.com/article/ruvv.html

Top