数据挖掘考试题目及答案

“数据挖掘考试题目及答案”相关的资料有哪些?“数据挖掘考试题目及答案”相关的范文有哪些?怎么写?下面是小编为您精心整理的“数据挖掘考试题目及答案”相关范文大全或资料大全,欢迎大家分享。

数据挖掘考试题目 - 简答题

标签:文库时间:2025-01-17
【bwwdw.com - 博文网】

数据挖掘考试题目——简答题

(1) 什么是数据挖掘?什么是知识发现?

答:数据挖掘是在大型数据存储库中,自动地发现有用的信息的过程。

知识发现是将未加工的数据转换为有用信息的整个过程。

(2) 数据挖掘要解决的问题包括哪五项?

答:可伸缩、高维性、异种数据和复杂数据、数据的所有权与分布、非传统的分析。

(3) 数据的属性分别包括哪几种类型?分别可执行什么操作? 答:

标称(nomial)相异性 =和≠ 序数(ordinal) 序 <、≤、>、≥ 区间(interval) 加法 +、- 比率(ratio) 乘法 ×、÷

(4) 数据中遗漏值的处理策略包括哪几种?

答:1、删除数据对象或属性,如遗漏数据对象很少 2、估计遗漏值,如插值或最近邻法

3、在分析时忽略遗漏值,如忽略属性计算相似度

(5) 数据预处理的工作可以包括哪两类? 答:1、选择分析所需要的数据对象和属性

2、创建或改变属性

(6) 聚集的目的是什么? 答:1、数据约减 2、改变尺度

3、提高数据的稳定性

(7) 有效抽样的定义是什么?

答:1、如果样本是有代表性的,则使用样本与使用整个数据集的效果几乎一样

2、样本具有足够的代表性的前提是它近似地

数据挖掘考试题库

标签:文库时间:2025-01-17
【bwwdw.com - 博文网】

一、 填空题

1. Web挖掘可分为 、 和 3大类。

2. 数据仓库需要统一数据源,包括统一 、统一 、统一 和统一数据特征4个方面。 3. 数据分割通常按时间、 、 、 以及组合方法进行。 4. 噪声数据处理的方法主要有 、 和 。

5. 数值归约的常用方法有 、 、 、 和对数模型等。 6. 评价关联规则的2个主要指标是 和 。

7. 多维数据集通常采用 或雪花型架构,以 表为中心,连接多个 表 。 8. 决策树是用 作为结点,用 作为分支的树结构。 9. 关联可分为简单关联、 和 。

10. BP神经网络的作用函数通常为 区间的 。

11. 数据挖掘的过程主要包括确定业务对象、 、 、 及知识同化等几个步骤。 12. 数据挖掘技术主要涉及 、 和 3个技术领域。

13. 数据挖掘的主要功能包括 、 、 、 、趋势分析、孤立点分析和偏差分析7个方面。 14. 人工神经网络具有 和 等特点,其结构模型包括 、 和自组织网络3种。 15. 数据仓库数据的4个基本特征是 、 、非易失、随时间变化。 16. 数据仓库的数据通常划分为 、 、 和 等几个

数据挖掘考试题库

标签:文库时间:2025-01-17
【bwwdw.com - 博文网】

一、 填空题

1. Web挖掘可分为 、 和 3大类。

2. 数据仓库需要统一数据源,包括统一 、统一 、统一 和统一数据特征4个方面。 3. 数据分割通常按时间、 、 、 以及组合方法进行。 4. 噪声数据处理的方法主要有 、 和 。

5. 数值归约的常用方法有 、 、 、 和对数模型等。 6. 评价关联规则的2个主要指标是 和 。

7. 多维数据集通常采用 或雪花型架构,以 表为中心,连接多个 表 。 8. 决策树是用 作为结点,用 作为分支的树结构。 9. 关联可分为简单关联、 和 。

10. BP神经网络的作用函数通常为 区间的 。

11. 数据挖掘的过程主要包括确定业务对象、 、 、 及知识同化等几个步骤。 12. 数据挖掘技术主要涉及 、 和 3个技术领域。

13. 数据挖掘的主要功能包括 、 、 、 、趋势分析、孤立点分析和偏差分析7个方面。 14. 人工神经网络具有 和 等特点,其结构模型包括 、 和自组织网络3种。 15. 数据仓库数据的4个基本特征是 、 、非易失、随时间变化。 16. 数据仓库的数据通常划分为 、 、 和 等几个

数据挖掘考试题库

标签:文库时间:2025-01-17
【bwwdw.com - 博文网】

一、 填空题

1. Web挖掘可分为 、 和 3大类。

2. 数据仓库需要统一数据源,包括统一 、统一 、统一 和统一数据特征4个方面。 3. 数据分割通常按时间、 、 、 以及组合方法进行。 4. 噪声数据处理的方法主要有 、 和 。

5. 数值归约的常用方法有 、 、 、 和对数模型等。 6. 评价关联规则的2个主要指标是 和 。

7. 多维数据集通常采用 或雪花型架构,以 表为中心,连接多个 表 。 8. 决策树是用 作为结点,用 作为分支的树结构。 9. 关联可分为简单关联、 和 。

10. BP神经网络的作用函数通常为 区间的 。

11. 数据挖掘的过程主要包括确定业务对象、 、 、 及知识同化等几个步骤。 12. 数据挖掘技术主要涉及 、 和 3个技术领域。

13. 数据挖掘的主要功能包括 、 、 、 、趋势分析、孤立点分析和偏差分析7个方面。 14. 人工神经网络具有 和 等特点,其结构模型包括 、 和自组织网络3种。 15. 数据仓库数据的4个基本特征是 、 、非易失、随时间变化。 16. 数据仓库的数据通常划分为 、 、 和 等几个

《我们的大数据时代》考试题目及答案

标签:文库时间:2025-01-17
【bwwdw.com - 博文网】

我们的大数据时代

(一)

单选题(每题2分)

1. 下列关于舍恩伯格对大数据特点的说法中,错误的是(D) A. 数据规模大 B. 数据类型多样 C. 数据处理速度快 D. 数据价值密度高

2. 下列关于大数据的分析理念的说法中,错误的是(D) A. 在数据基础上倾向于全体数据而不是抽样数据 B. 在分析方法上更注重相关分析我不是因果分析 C. 在分析效果上更追究效率而不是绝对精确 D. 在数据规模上强调相对数据而不是绝对数据 3. 万维网之父是(C) A. 彼得·德鲁克 B. 舍恩伯格

C. 蒂姆·伯纳斯—李 D. 斯科特·布朗

4. 下列关于普查的缺点的说法中,正确的是(A)。

A. 工作量较大,容易导致调查内容有限、产生重复和遗漏现象 B. 误差不易被控制

C. 对样本的依赖性比较强 D. 评测结果不够稳定

5.下列关于聚类挖掘技术的说法中,错误的是(B)。

A. 不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别 B. 要求同类数据的内容相似度尽可能小 C. 要求不同类数据的内容相似度尽可能小

D. 与分类挖掘技术相似的是,都是

数据库考试题目和答案

标签:文库时间:2025-01-17
【bwwdw.com - 博文网】

考试试卷

2005 -- 2006 学年 1 学期

《数据库技术》课程设计课程 40 学时 2 学分考试形式: 开 卷 专业年级:信管、金融、工商等,2004级 1、 对于教学数据库(TEACH)构造3个基本表:

S(SNUM,SNAME,SDEPT,AGE,SEX);( 注:SDEPT为“学生所属系/院名”) C(CNUM,CNAME,TEACHER,PCNUM);( 注:PCNUM为“先修课程编号”) SC(SNUM,CNUM,GRADE);

(1)创建教学数据库:学生信息表、课程信息表、学生选课表;

(2)为每个基表添加多条记录(自己添加,所添加的数据要能够满足以下各题的查询要求);

(3)检索年龄大于23岁的男学生的学号和姓名; (4)检索’liu’老师所授课程的课程号和课程名;

(5)检索学号为’S3’的学生所学课程的课程名与任课教师名; (6)检索至少选修’liu’老师所授课程中一门课程的男学生姓名; (7)检索没有选修’liu’老师所授课程的女学生姓名和学号; (8)检索’wang’同学不学的课程的课程号; (9)检索至少选修两门课程的学生的姓名和学号; (10) (11) (12) (13) (14) (

数据库考试题目和答案

标签:文库时间:2025-01-17
【bwwdw.com - 博文网】

考试试卷

2005 -- 2006 学年 1 学期

《数据库技术》课程设计课程 40 学时 2 学分考试形式: 开 卷 专业年级:信管、金融、工商等,2004级 1、 对于教学数据库(TEACH)构造3个基本表:

S(SNUM,SNAME,SDEPT,AGE,SEX);( 注:SDEPT为“学生所属系/院名”) C(CNUM,CNAME,TEACHER,PCNUM);( 注:PCNUM为“先修课程编号”) SC(SNUM,CNUM,GRADE);

(1)创建教学数据库:学生信息表、课程信息表、学生选课表;

(2)为每个基表添加多条记录(自己添加,所添加的数据要能够满足以下各题的查询要求);

(3)检索年龄大于23岁的男学生的学号和姓名; (4)检索’liu’老师所授课程的课程号和课程名;

(5)检索学号为’S3’的学生所学课程的课程名与任课教师名; (6)检索至少选修’liu’老师所授课程中一门课程的男学生姓名; (7)检索没有选修’liu’老师所授课程的女学生姓名和学号; (8)检索’wang’同学不学的课程的课程号; (9)检索至少选修两门课程的学生的姓名和学号; (10) (11) (12) (13) (14) (

数据库考试题目和答案分析

标签:文库时间:2025-01-17
【bwwdw.com - 博文网】

山东建筑大学管理学院 实验报告

课程 数据库原理 班级 信管10 姓名徐凯 学号 2010021388 实验时间2011年 9 月 29 日 18时 分00至 19 时30 分 实验1 表的创建与表的查询

实验题目:(自己填)

实验报告内容:(必须贴图) 5(1)

(2)

1

山东建筑大学管理学院 实验报告

课程 数据库原理 班级 信管10 姓名徐凯 学号 2010021388 实验时间2011年 9 月 29 日 18时 分00至 19 时30 分 (3)

(4)

(5)

2

山东建筑大学管理学院 实验报告

课程 数据库原理 班级 信管10 姓名徐凯 学号 2010021388 实验时间2011年 9 月 29 日 18时 分00至 19 时30 分

(6)

3

山东建筑大学管理学院 实验报告

课程 数据库原理 班级 信管10 姓名徐凯 学号 2010021388 实验时间2011年 9 月 29 日 18时 分00至 19 时30 分 (7)

(8)

4

山东建筑大学管理学院 实验报告

课程 数据库原

2011年数据挖掘与数据仓库考试题

标签:文库时间:2025-01-17
【bwwdw.com - 博文网】

2011年数据挖掘与数据仓库考试题

1. (10分)讨论::下列每项活动是否是数据挖掘任务?简单陈述你的理由。

(a) 根据性别划分公司的顾客。 (b) 根据可赢利性划分公司的顾客。 (c) 预测投一对骰子的结果。

(d) 使用历史记录预测某公司未来的股票价格。

2. (10分)列举3种数据挖掘功能,对每种举2个实际应用的例子。

3. (10分)比较急切分类(如,判定树、贝叶斯、神经网络)相对于懒散分类(如,k -最临近、基于案例的推理)的优缺点。 4. (10分)假定你作为一个数据分析人员,受雇于一家移动通讯公司。通过一个例子说明

打算如何使用数据挖掘技术为公司提供帮助。你的例子应包含问题描述,使用何种数据挖掘方法解决该问题,理由和预期效果(不需要定量分析)。

5. (10分)假设数据挖掘的任务是将如下的八个点(用(x,y)代表位置)聚类为三个类。 A1(2,10),A2(2,5),A3(8,4),B1(5,8),B2(7,5),B3(6,4),C1(1,2),C2(4,9)

距离函数是Euclidean函数。假设初始我们选择A1,B1,和C1为每个簇的中心,用k-means算法来给出

(a) 在第一次循环执行后的三个簇中心 (b) 最后的

上机考试题目及答案

标签:文库时间:2025-01-17
【bwwdw.com - 博文网】

题目

--1、查找员工的编号、姓名、部门和出生日期,如果出生日期为空值, --显示日期不详,并按部门排序输出,日期格式为yyyy-mm-dd。

--2、查找与喻自强在同一个单位的员工姓名、性别、部门和职称

--3、按部门进行汇总,统计每个部门的总工资

--4、查找商品名称为14寸显示器商品的销售情况, --显示该商品的编号、销售数量、单价和金额

--5、在销售明细表中按产品编号进行汇总,统计每种产品的销售数量和金额

--6、按客户编号统计每个客户1996年的订单总金额

--7、查找有销售记录的客户编号、名称和订单总额

--8、查找在1997年中有销售记录的客户编号、名称和订单总额

--9、查找一次销售最大的销售记录

--10、查找至少有3次销售的业务员名单和销售日期

--11、用存在量词查找没有订货记录的客户名称

--12、使用左外连接查找每个客户的客户编号、名称、订货日期、订单金额 --订货日期不要显示时间,日期格式为yyyy-mm-dd --按客户编号排序,同一客户再按订单降序排序输出

--13、查找16M DRAM的销售情况,要求显示相应的销售员的姓名、 --性别,销售日期、销售数量和金额,其中性别用男、女表示