数据挖掘试题期末

“数据挖掘试题期末”相关的资料有哪些?“数据挖掘试题期末”相关的范文有哪些?怎么写?下面是小编为您精心整理的“数据挖掘试题期末”相关范文大全或资料大全,欢迎大家分享。

2014数据挖掘期末试题

标签:文库时间:2024-11-20
【bwwdw.com - 博文网】

数据挖掘 期末试题(2014学年)

一、(20分)假定用于分析的数据包含属性age。数据元组的age值(以递增序)是:

5, 15, 25, 35, 45, 55, 60。

(a) 该数据的均值是______, 中位数是_____(4分) (b) 数据的中列数是______(2分)

(c) 第一个四分位数(Q1)是_____和第三个四分位数(Q3)是_____(4分) (d) 给出数据的五数概括:______________________(4分)

(e) 使用min-max规范化将age值35变换到[0.1,1.0]区间的值是:_____(2分) (f) 使用z-score规范化变换age值35的值是______(2分) (g) 使用小数定标规范化变换age值35的值是______(2分) 二、(20分)下面的相依表汇总了超级市场的事务数据,其中hot dogs表示包含热狗的事务,

~hot dogs 表示不包含热狗的事务,hamburgers表示包含汉堡包的事务,~hamburgers表示不包含汉堡包的事务。

(a) 假定挖掘出了关联规则 “hot dogs=>humburgers”。给定最小支持度阈值60%,

最小置信度阈值50%,该关

数据挖掘期末复习

标签:文库时间:2024-11-20
【bwwdw.com - 博文网】

《数据挖掘》总复习题

1. 数据挖掘系统可以根据什么标准进行分类?

挖掘的数据库类型分类、挖掘的知识类型分类、所用的技术分类、应用分类 2.知识发现过程包括哪些步骤?

数据清理、数据集成、数据选择、数据变换、数据挖掘、模式评估、知识表示 3.什么是概念分层?

一个概念分层定义一个映射序列,将底层概念到更一般的高层概念。 4.多维数据模型上的OLAP操作包括哪些?

上卷、下钻、切片和切块、转轴、其它OLAP操作 5.OLAP服务器类型有哪几种?

关系OLAP(ROLAP)服务器、多维OLAP(MOLAP)服务器、 混合OLAP(HOLAP)服务器、特殊的SQL服务器 6.数据预处理技术包括哪些?

数据清理、数据集成、数据变换、数据归约 7.什么是数据清理?

数据清理例程可以用于填充遗漏的值,平滑数据,找出局外者并纠正数据的不一致性 8.什么是数据集成?

数据集成将多个数据源中的数据结合成、存放在一个一致的数据存储,如数据仓库中。 这些源可能包括多个数据库、数据方或一般文件。 9.什么是数据归约?

数据归约技术,如数据方聚集、维归约、数据压缩、数值归约和离散化都可以用来得到数据的归约表示,而使得信息内容的损失最小。 10.数据清理的

数据挖掘试题

标签:文库时间:2024-11-20
【bwwdw.com - 博文网】

单选题

1. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A)

A. 关联规则发现 B. 聚类

C. 分类 D. 自然语言处理

3. 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C) A. 频繁模式挖掘 B. 分类和预测 C. 数据预处理 D. 数据流挖掘

4. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?(B)

A. 分类 B. 聚类 C. 关联分析 D. 隐马尔可夫链

6. 使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务?(A) A. 探索性数据分析 B. 建模描述

C. 预测建模 D. 寻找模式和规则 11.下面哪种不属于数据预处理的方法? (D)

A变量代换 B离散化 C 聚集 D 估计遗漏值

12. 假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 5

数据挖掘期末论文框架例

标签:文库时间:2024-11-20
【bwwdw.com - 博文网】

数据挖掘期末论文框架例

数据挖掘在****中的应用

摘要:

关键词:

1. 引言

****概念数据挖掘概念

2. 国内外研究现状

总体描述

某某人在某篇文章提出***观点

3. 数据挖掘应用框架

流程图

步骤语言描述

4. 数据挖掘应用实例

写出实例按照应用框架一步步展开

5. 结论与展望

实例的结果和该领域未来应用趋势描述 参考文献:

数据挖掘模拟试题(二)

标签:文库时间:2024-11-20
【bwwdw.com - 博文网】

数据挖掘模拟题B

一、选择题

1. 下列数据挖掘任务中,哪些属于非定向数据挖掘任务(D) A 分类

B 回归

C 预测 D 聚类

2. 数据挖掘的经典案例“啤酒与尿布试验”最主要是应用了(C )数据挖掘方法。

A 分类 B 预测 C 组合或关联法则 D聚类 3.数据挖掘技术包括三个主要的部分 ( C ) A.数据、模型、技术 B.算法、技术、领域知识

C.数据、建模能力、算法与技术 D.建模能力、算法与技术、领域知识 4.在有指导的数据挖掘中,有关测试集的说法错误的是(A) A. 测试集和训练集是相互联系的 B. 测试集是用以测试模型的数据集 C. 通常测试集大约占总样本的三分之一

D. K-次交叉验证中,测试集只有 1 个,训练集有K-1个。 5.在ID3算法中信息增益是指( D ) A.信息的溢出程度 B. 信息的增加效益 C .熵增加的程度最大 D. 熵减少的程度最大

6. 下面关于时间系列分析与回归分析的关系中,错误的是( D )

A 时间序列分析方法明确强调变量值顺序的重要性,而回归分析方法则不必如此 B 时间序列各观察值之间存在一定的依存关系,而回归分析一般要求每一变量

数据挖掘试题参考答案

标签:文库时间:2024-11-20
【bwwdw.com - 博文网】

数据挖掘试题参考答案

大学课程《数据挖掘》试题参考答案

范围:

1.什么是数据挖掘?它与传统数据分析有什么区别?

定义:

数据挖掘(Data Mining,DM)又称数据库中的知识发现(Knowledge Discover in Database,KDD),是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。

区别:

(1)数据挖掘的数据源与以前相比有了显著的改变;

数据是海量的;

数据有噪声;

数据可能是非结构化的;

(2)传统的数据分析方法一般都是先给出一个假设然后通过数据验证,在一定意义上是假设驱动的;与之相反,数据挖掘在一定意义上是发现驱动的,模式都是通过大量的搜索工作从数据中自动提取出来 。即数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值。

在缺乏强有力的数据分析工具而不能分析这些资源的情况

数据挖掘期末复习提纲(整理版)

标签:文库时间:2024-11-20
【bwwdw.com - 博文网】

1. 熟悉数据挖掘的流程:

提示:1)业务理解 2)数据理解 3)数据准备 4)建立模型 5)模型评估 6)模型发布

2. 数据库系统与数据仓库系统的区别:

数据仓库是一个面向主题的、集成的、时变的和非易失的数据集合,支持管理部门的决策过程:而数据库是面向具体操作的、单一的、实时的、更新的数据集合,支持管理机构日常操作的。数据库系统的主要任务是执行联机事务和查询处理,这种系统称为OLTP系统,涵盖了组织机构的大部分日常操作;另一方面,数据仓库在数据分析和决策方面为用户和知识工人提供服务。 具体表述如下: 项目 数据类型 数据组织方式 试图机制 系统开发方法 面向应用 工具 功能 优化 索引 数据库系统 操作型数据 面向应用 虚表存储,只存视图结构 需求驱动 面向OLTP 数据仓库系统 分析型数据 面型主题 实试图存储 数据驱动 面向OLAP 分析和一般查询 简单 系统决策和分析 完整结构 数据查询、开发 复杂 事务处理和访问 有限数量 自由空间 更新开销 更新操作 需要附加数量空间 大 增、删、改频繁 无 无 少 3. 数据聚合需考虑的问题;

4. 利用免费商品做促销的关联规则挖掘问题:

1)找到免费商品的频繁1—项集,记为S1。

2)

数据仓库与数据挖掘考试试题

标签:文库时间:2024-11-20
【bwwdw.com - 博文网】

中国矿业大学银川学院期末考试试题

2010至2011学年第2学期

考试科目 数据仓库与数据挖掘 学分 2 年级 2008 系 机电动力与信息工程系 专业 计算机

一、 填空题(15分)

1.数据仓库的特点分别是 、 、 、反映历史变化。

2.元数据是描述数据仓库内数据的结构和建立方法的数据。根据元数据用途的不同可将元数据分为 元数据和 元数据两类。 3.OLAP

技术多维分析过程中,多维分析操作包

括 、 、 、 等。 4.基于依赖型数据集市和操作型数据存储的数据仓库体系结构常常被称为“ ”架构,其中 是中心,源数据系统和数据集市在输入和输出范围的两端。 5.ODS实际上是一个集成的、 、 、 、 、详细的数据库,也叫运营数据存储。 二、 多项选择题(10分)

6.在数据挖掘的分析方法中,直接数据

数据挖掘考试题库

标签:文库时间:2024-11-20
【bwwdw.com - 博文网】

一、 填空题

1. Web挖掘可分为 、 和 3大类。

2. 数据仓库需要统一数据源,包括统一 、统一 、统一 和统一数据特征4个方面。 3. 数据分割通常按时间、 、 、 以及组合方法进行。 4. 噪声数据处理的方法主要有 、 和 。

5. 数值归约的常用方法有 、 、 、 和对数模型等。 6. 评价关联规则的2个主要指标是 和 。

7. 多维数据集通常采用 或雪花型架构,以 表为中心,连接多个 表 。 8. 决策树是用 作为结点,用 作为分支的树结构。 9. 关联可分为简单关联、 和 。

10. BP神经网络的作用函数通常为 区间的 。

11. 数据挖掘的过程主要包括确定业务对象、 、 、 及知识同化等几个步骤。 12. 数据挖掘技术主要涉及 、 和 3个技术领域。

13. 数据挖掘的主要功能包括 、 、 、 、趋势分析、孤立点分析和偏差分析7个方面。 14. 人工神经网络具有 和 等特点,其结构模型包括 、 和自组织网络3种。 15. 数据仓库数据的4个基本特征是 、 、非易失、随时间变化。 16. 数据仓库的数据通常划分为 、 、 和 等几个

医药数据挖掘

标签:文库时间:2024-11-20
【bwwdw.com - 博文网】

山西省中医药研究院

医药数据挖掘

Data mining in medicine

季海霞1

山西省中医药研究院 ,030012 ,2533360723@qq.com

1简介 ....................................................................... 1 2过程 ....................................................................... 1 3常用算法 ................................................................... 2

3.1 关联分析 ............................................................. 3 3.2 分类分析 ............................................................. 3

3.3 聚类分析 ...........................................................