数据挖掘试题150道

“数据挖掘试题150道”相关的资料有哪些?“数据挖掘试题150道”相关的范文有哪些?怎么写?下面是小编为您精心整理的“数据挖掘试题150道”相关范文大全或资料大全,欢迎大家分享。

数据挖掘试题

标签:文库时间:2024-10-07
【bwwdw.com - 博文网】

单选题

1. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A)

A. 关联规则发现 B. 聚类

C. 分类 D. 自然语言处理

3. 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C) A. 频繁模式挖掘 B. 分类和预测 C. 数据预处理 D. 数据流挖掘

4. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?(B)

A. 分类 B. 聚类 C. 关联分析 D. 隐马尔可夫链

6. 使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务?(A) A. 探索性数据分析 B. 建模描述

C. 预测建模 D. 寻找模式和规则 11.下面哪种不属于数据预处理的方法? (D)

A变量代换 B离散化 C 聚集 D 估计遗漏值

12. 假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 5

GSM考试试题(150道)

标签:文库时间:2024-10-07
【bwwdw.com - 博文网】

一. 选 择 题:

1. 选择C1算法跟以下那个因素有关? a. Rxlev_min b. MS_Txpwr_Max c. Rxlev_Access_Min d. BS_Txpwr_Max

2. 避免因过多跨越LAC的小区重选而造成的SDCCH的阻塞,我们将与该小区有切换关系且与之LAC不同的相邻小区的 参数提高? a. T3212

b. Cell_Reselect_Hysteresis(CRH) c. Cell_Reselect_offset d. Rxlev_Access_Min

3.在一个城市的GSM系统内,小区识别码CGI: A

A.是唯一的。 B.可以有2个小区相同。 C.可以有3个小区相同。 D.可以有任意多个小区相同。

4.‘Call Proceding’是在以下哪个过程中被用到? a. MOC b. MTC

c. Location Update d. Handover

5. 如果一个网络运营商分别有15 MHz的上、下行频宽,那么他可以获得多少个GSM频点 (减去一个保护频点)? a. 600 b. 599 c. 75 d. 74

6. 由于阻挡物而产生的类似阴影效果的无线信号

数据挖掘模拟试题(二)

标签:文库时间:2024-10-07
【bwwdw.com - 博文网】

数据挖掘模拟题B

一、选择题

1. 下列数据挖掘任务中,哪些属于非定向数据挖掘任务(D) A 分类

B 回归

C 预测 D 聚类

2. 数据挖掘的经典案例“啤酒与尿布试验”最主要是应用了(C )数据挖掘方法。

A 分类 B 预测 C 组合或关联法则 D聚类 3.数据挖掘技术包括三个主要的部分 ( C ) A.数据、模型、技术 B.算法、技术、领域知识

C.数据、建模能力、算法与技术 D.建模能力、算法与技术、领域知识 4.在有指导的数据挖掘中,有关测试集的说法错误的是(A) A. 测试集和训练集是相互联系的 B. 测试集是用以测试模型的数据集 C. 通常测试集大约占总样本的三分之一

D. K-次交叉验证中,测试集只有 1 个,训练集有K-1个。 5.在ID3算法中信息增益是指( D ) A.信息的溢出程度 B. 信息的增加效益 C .熵增加的程度最大 D. 熵减少的程度最大

6. 下面关于时间系列分析与回归分析的关系中,错误的是( D )

A 时间序列分析方法明确强调变量值顺序的重要性,而回归分析方法则不必如此 B 时间序列各观察值之间存在一定的依存关系,而回归分析一般要求每一变量

2014数据挖掘期末试题

标签:文库时间:2024-10-07
【bwwdw.com - 博文网】

数据挖掘 期末试题(2014学年)

一、(20分)假定用于分析的数据包含属性age。数据元组的age值(以递增序)是:

5, 15, 25, 35, 45, 55, 60。

(a) 该数据的均值是______, 中位数是_____(4分) (b) 数据的中列数是______(2分)

(c) 第一个四分位数(Q1)是_____和第三个四分位数(Q3)是_____(4分) (d) 给出数据的五数概括:______________________(4分)

(e) 使用min-max规范化将age值35变换到[0.1,1.0]区间的值是:_____(2分) (f) 使用z-score规范化变换age值35的值是______(2分) (g) 使用小数定标规范化变换age值35的值是______(2分) 二、(20分)下面的相依表汇总了超级市场的事务数据,其中hot dogs表示包含热狗的事务,

~hot dogs 表示不包含热狗的事务,hamburgers表示包含汉堡包的事务,~hamburgers表示不包含汉堡包的事务。

(a) 假定挖掘出了关联规则 “hot dogs=>humburgers”。给定最小支持度阈值60%,

最小置信度阈值50%,该关

数据挖掘试题参考答案

标签:文库时间:2024-10-07
【bwwdw.com - 博文网】

数据挖掘试题参考答案

大学课程《数据挖掘》试题参考答案

范围:

1.什么是数据挖掘?它与传统数据分析有什么区别?

定义:

数据挖掘(Data Mining,DM)又称数据库中的知识发现(Knowledge Discover in Database,KDD),是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。

区别:

(1)数据挖掘的数据源与以前相比有了显著的改变;

数据是海量的;

数据有噪声;

数据可能是非结构化的;

(2)传统的数据分析方法一般都是先给出一个假设然后通过数据验证,在一定意义上是假设驱动的;与之相反,数据挖掘在一定意义上是发现驱动的,模式都是通过大量的搜索工作从数据中自动提取出来 。即数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值。

在缺乏强有力的数据分析工具而不能分析这些资源的情况

数据仓库与数据挖掘考试试题

标签:文库时间:2024-10-07
【bwwdw.com - 博文网】

中国矿业大学银川学院期末考试试题

2010至2011学年第2学期

考试科目 数据仓库与数据挖掘 学分 2 年级 2008 系 机电动力与信息工程系 专业 计算机

一、 填空题(15分)

1.数据仓库的特点分别是 、 、 、反映历史变化。

2.元数据是描述数据仓库内数据的结构和建立方法的数据。根据元数据用途的不同可将元数据分为 元数据和 元数据两类。 3.OLAP

技术多维分析过程中,多维分析操作包

括 、 、 、 等。 4.基于依赖型数据集市和操作型数据存储的数据仓库体系结构常常被称为“ ”架构,其中 是中心,源数据系统和数据集市在输入和输出范围的两端。 5.ODS实际上是一个集成的、 、 、 、 、详细的数据库,也叫运营数据存储。 二、 多项选择题(10分)

6.在数据挖掘的分析方法中,直接数据

数据挖掘考试题库

标签:文库时间:2024-10-07
【bwwdw.com - 博文网】

一、 填空题

1. Web挖掘可分为 、 和 3大类。

2. 数据仓库需要统一数据源,包括统一 、统一 、统一 和统一数据特征4个方面。 3. 数据分割通常按时间、 、 、 以及组合方法进行。 4. 噪声数据处理的方法主要有 、 和 。

5. 数值归约的常用方法有 、 、 、 和对数模型等。 6. 评价关联规则的2个主要指标是 和 。

7. 多维数据集通常采用 或雪花型架构,以 表为中心,连接多个 表 。 8. 决策树是用 作为结点,用 作为分支的树结构。 9. 关联可分为简单关联、 和 。

10. BP神经网络的作用函数通常为 区间的 。

11. 数据挖掘的过程主要包括确定业务对象、 、 、 及知识同化等几个步骤。 12. 数据挖掘技术主要涉及 、 和 3个技术领域。

13. 数据挖掘的主要功能包括 、 、 、 、趋势分析、孤立点分析和偏差分析7个方面。 14. 人工神经网络具有 和 等特点,其结构模型包括 、 和自组织网络3种。 15. 数据仓库数据的4个基本特征是 、 、非易失、随时间变化。 16. 数据仓库的数据通常划分为 、 、 和 等几个

医药数据挖掘

标签:文库时间:2024-10-07
【bwwdw.com - 博文网】

山西省中医药研究院

医药数据挖掘

Data mining in medicine

季海霞1

山西省中医药研究院 ,030012 ,2533360723@qq.com

1简介 ....................................................................... 1 2过程 ....................................................................... 1 3常用算法 ................................................................... 2

3.1 关联分析 ............................................................. 3 3.2 分类分析 ............................................................. 3

3.3 聚类分析 ...........................................................

数据挖掘考试题库

标签:文库时间:2024-10-07
【bwwdw.com - 博文网】

一、 填空题

1. Web挖掘可分为 、 和 3大类。

2. 数据仓库需要统一数据源,包括统一 、统一 、统一 和统一数据特征4个方面。 3. 数据分割通常按时间、 、 、 以及组合方法进行。 4. 噪声数据处理的方法主要有 、 和 。

5. 数值归约的常用方法有 、 、 、 和对数模型等。 6. 评价关联规则的2个主要指标是 和 。

7. 多维数据集通常采用 或雪花型架构,以 表为中心,连接多个 表 。 8. 决策树是用 作为结点,用 作为分支的树结构。 9. 关联可分为简单关联、 和 。

10. BP神经网络的作用函数通常为 区间的 。

11. 数据挖掘的过程主要包括确定业务对象、 、 、 及知识同化等几个步骤。 12. 数据挖掘技术主要涉及 、 和 3个技术领域。

13. 数据挖掘的主要功能包括 、 、 、 、趋势分析、孤立点分析和偏差分析7个方面。 14. 人工神经网络具有 和 等特点,其结构模型包括 、 和自组织网络3种。 15. 数据仓库数据的4个基本特征是 、 、非易失、随时间变化。 16. 数据仓库的数据通常划分为 、 、 和 等几个

数据挖掘考试题库

标签:文库时间:2024-10-07
【bwwdw.com - 博文网】

一、 填空题

1. Web挖掘可分为 、 和 3大类。

2. 数据仓库需要统一数据源,包括统一 、统一 、统一 和统一数据特征4个方面。 3. 数据分割通常按时间、 、 、 以及组合方法进行。 4. 噪声数据处理的方法主要有 、 和 。

5. 数值归约的常用方法有 、 、 、 和对数模型等。 6. 评价关联规则的2个主要指标是 和 。

7. 多维数据集通常采用 或雪花型架构,以 表为中心,连接多个 表 。 8. 决策树是用 作为结点,用 作为分支的树结构。 9. 关联可分为简单关联、 和 。

10. BP神经网络的作用函数通常为 区间的 。

11. 数据挖掘的过程主要包括确定业务对象、 、 、 及知识同化等几个步骤。 12. 数据挖掘技术主要涉及 、 和 3个技术领域。

13. 数据挖掘的主要功能包括 、 、 、 、趋势分析、孤立点分析和偏差分析7个方面。 14. 人工神经网络具有 和 等特点,其结构模型包括 、 和自组织网络3种。 15. 数据仓库数据的4个基本特征是 、 、非易失、随时间变化。 16. 数据仓库的数据通常划分为 、 、 和 等几个