数据仓库与数据挖掘考试试题

更新时间:2023-10-07 14:52:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

中国矿业大学银川学院期末考试试题

2010至2011学年第2学期

考试科目 数据仓库与数据挖掘 学分 2 年级 2008 系 机电动力与信息工程系 专业 计算机

一、 填空题(15分)

1.数据仓库的特点分别是 、 、 、反映历史变化。

2.元数据是描述数据仓库内数据的结构和建立方法的数据。根据元数据用途的不同可将元数据分为 元数据和 元数据两类。 3.OLAP

技术多维分析过程中,多维分析操作包

括 、 、 、 等。 4.基于依赖型数据集市和操作型数据存储的数据仓库体系结构常常被称为“ ”架构,其中 是中心,源数据系统和数据集市在输入和输出范围的两端。 5.ODS实际上是一个集成的、 、 、 、 、详细的数据库,也叫运营数据存储。 二、 多项选择题(10分)

6.在数据挖掘的分析方法中,直接数据挖掘包括( )

A 分类 B 关联 C 估值 D 预言 7.数据仓库的数据ETL过程中,ETL软件的主要功能包括( ) A 数据抽取 B 数据转换 C 数据加载 D 数据稽核 8.数据分类的评价准则包括( )

A 精确度 B 查全率和查准率 C F-Measure D 几何均值 9.层次聚类方法包括( )

A 划分聚类方法 B 凝聚型层次聚类方法 C 分解型层次聚类方法 D 基于密度聚类方法

10.贝叶斯网络由两部分组成,分别是( )

A 网络结构 B 先验概率 C 后验概率 D 条件概率表 三、 计算题(30分)

11.一个食品连锁店每周的事务记录如下表所示,其中每一条事务表示在一项收款机业务中卖出的项目,假定supmin=20%,confmin=40%,使用Apriori算法计算生成的关联规则,标明每趟数据库扫描时的候选集和大项目集。(15分) 事务 T1 项目 面包、果冻、花生酱 事务 T4 T5 项目 啤酒、面包 啤酒、牛奶 T2 面包、花生酱 T3 面包、牛奶、花生酱

12.给定以下数据集(2 ,4,10,12,15,3,21,11,18,25,30),进行K-Means聚类,设定聚类数为2个,相似度按照欧式距离计算。(15分)

四.设计题(45分)

13.按照题目给定的3个数据文件,任选一个建立数据流图,要求至少包括记录选项、字段选项、图形结点各一个。任选关联规则Apriori算法、贝叶斯网络、K-Means聚类、决策树C5.0(C4.5)算法、神经网络中的一个进行挖掘,并给出数据流图。(10分)

14.对以上数据流图中使用的每个结点做一简短说明。(10分)

15.给出以上数据流图中模型的执行结果(生成模型完全展开后的数据),对于执行结果太多的,可节选部分结果。(10分)

16.对以上模型生成的结果做一简要的分析,包括算法采用的基本原理、数学模型、算法步骤等。(15分)

本文来源:https://www.bwwdw.com/article/y43d.html

Top