《数据挖掘》教学大纲

更新时间:2024-01-28 05:12:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

河北经贸大学课程水平认定 《数据挖掘》学习大纲

课程名称 总 学 时 适用专业

数据挖掘 32学时 统计学 课程类型 学 分 开课单位 必修课 2学分 数统学院 一、学习性质

《数据挖掘》是大数据背景下现代统计数据分析不可缺少的重要工具。通过本课程的学习,培养学生的数据分析技能,熟悉和掌握大数据信息提取与结果分析,培养适应社会数据分析岗位需求的专业人才。

二、学习目的

本课程目的主要是让学生在学习期间掌握数据挖掘理论以及如何用数据挖掘来解决实际问题,了解某个数据挖掘解决方案对特定问题是否切实可行,学习知识发现的过程,利用基本的统计和非统计技术评估数据挖掘对话的结果等。

三、学习要求

重点掌握几种数据挖掘策略及每种策略的适用时机;如何通过几种数据挖掘技术建立模型来解决问题。

四、课程内容与学时分配

课程内容与学时分配 学时分配 课 程 内 容 自学 第一章 引言 第二章 数据预处理 第三章 分类和预测 第四章 复杂类型数据的挖掘 第五章 数据挖掘的应用和发展趋势

2 2 4 4 2 自学研讨调研 2 2 8 4 2 五、课程考核和成绩评定

课程考核为闭卷考试。

成绩评定:考试成绩实行百分制,其中基础知识测试题的分值掌握在40分左右;综合能力测试题的分值掌握在60分左右。60分为及格。

六、推荐教材和学习参考书

推荐教程 作者 JIAWEI HAN MICHELINE KAMBER 学习参考书 数据挖掘导论 作者 范明,范红建 出版社及出版时间 人民邮电出版社,2006 出版社及出版时间 数据挖掘:概念与技术 机械工业出版社,2006 数据挖掘与应用 张俊妮 北京大学出版社,2009 数据挖掘-概念、模型、闪四清,陈茵,程雁 方法和算法

清华大学出版社,2003 七、学习具体内容

第一章 引言

一、基本要求

要求学生重点了解当今世界上流行数据挖掘技术的应用范围和流程,对数据挖掘有一个总体的认识;重点掌握Clementine基本功能和操作;海量数据的选择,会正确解释软件处理的结果,尤其掌握样本信息的解释。 二、授课方法

自学。 三、学习内容

(一)什么激发了数据挖掘以及它的重要性 (二)数据挖掘定义

(三)在何种数据上进行数据挖掘

1、关系数据库 2、数据仓库 3、事务数据库

4、高级数据库系统和高级数据库应用 (四)数据挖掘功能——可以挖掘什么类型的模式

1、关联分析 2、分类和预测 3、聚类分析 4、孤立点分析 5、演变分析

(五)数据挖掘软件Clementine的基本功能和操作 四、重点难点

数据挖掘的概念和基本功能 五、思考与讨论

1、什么是数据挖掘? 2、数据挖掘的对象是什么?

3、数据挖掘的主要功能有哪些? 4、Clementine的基本功能和操作。

第二章 数据预处理

一、基本要求

要求学生重点掌握数据预处理的用途,能正确解释软件处理的结果,尤其是样本信息的解释;同时要求学生阅读一定数量的文献资料,加深理解如何对数据集进行合理的数据预处理。 二、授课方法

自学。 三、学习内容

(一)数据预处理的原因 (二)数据集成和变换

1、数据集成 2、数据变换 (三)缺失值处理的方法

1、处理带有缺失值的记录 2、处理带有缺失值的字段 3、归因或填充缺失值 4、用于缺失值的CLEM 函数 四、重点难点

数据集中缺失值的处理方法及Clementine软件实现。 五、思考与讨论

1、为什么进行数据预处理?

2、数据预处理的主要方法和适用范围是什么?

第三章 分类和预测

一、基本要求

要求学生理解分类、预测的各种建模方法的基本思想,掌握分类、预测建模方法的软件实现,了解分类、预测方法的基本应用。

二、授课方法

自学。 三、学习内容

(一)什么是分类,什么是预测 (二)分类预测:决策树

1、决策树的基本思想 2、C5.0算法及软件实现 3、决策树的案例及分析 (三)分类预测:神经网络

1、神经网络的基本思想 2、神经网络的软件实现 3、神经网络的案例及分析 (四)预测

1、线性回归和多元回归 2、非线性回归 3、其他回归模型 (五)分类预测的准确性

1、评估分类法的准确率 2、提高分类法的准确率 3、准确率足够判定分类法吗 四、重点难点

分类、预测的各种建模方法、软件实现及应用 五、思考与讨论

1、分类预测的作用和基本思想是什么? 2、决策树的基本思想和软件实现。 3、神经网络的基本思想和软件实现。 4、分类预测模型的评估。

第四章 复杂类型数据的挖掘

一、基本要求

要求学生对复杂类型数据的挖掘方法有一个概括的认识,理解并掌握时间序列数据挖掘模型的构建方法及应用。 二、授课方法

自学。 三、学习内容

(一)复杂数据对象的多维分析和描述性挖掘

1、结构化数据的概化

2、空间和多媒体数据概化中的聚集和近似计算 3、对象标识符和类 4、类复合层次的概化 5、对象立方体的构造与挖掘

6、用分而治之方法对规则数据库进行基于概化的挖掘 (二)空间数据库挖掘

1、空间数据立方体构造和空间OLAP 2、空间关联分析 3、空间聚类方法

4、空间分类和空间趋势分析 5、光栅数据库挖掘

(三)时序数据和序列数据的挖掘

1、趋势分析

2、时序分析中的相似搜索 3、序列模式挖掘 4、周期分析 四、重点难点

时间序列数据挖掘模型的构建方法及应用 五、思考与讨论

1、什么是复杂类型数据?

2、复杂类型数据的数据挖掘模型主要有哪些? 3、时间序列数据挖掘模型的构建方法及软件实现。

第五章 数据挖掘的应用和发展趋势

一、基本要求

要求学生了解数据挖掘的应用和发展趋势。 二、授课方法

自学。 三、学习内容 (一)数据挖掘的应用

1、针对生物医学和DNA数据分析的数据挖掘 2、针对金融数据分析的数据挖掘 3、零售业中的数据挖掘 4、电信业中的数据挖掘 (二)数据挖掘的发展趋势 四、重点难点

数据挖掘的应用范围和发展趋势。 五、思考与讨论

1、数据挖掘的主要应用领域。 2、数据挖掘的发展趋势。

本文来源:https://www.bwwdw.com/article/p7nw.html

Top