数据挖掘实验1

更新时间:2023-09-14 23:17:02 阅读量: 资格考试认证 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

武 汉 工 程 大 学

计算机科学与工程学院

《数据仓库与数据挖掘》实验报告[1]

专业班级 学生学号 学生姓名 实验项目 实验类别 09信技03 0905060322 张东梅 数据仓库的基本操作及多维数据的组织与分析 操作性 实验时间 实验地点 指导教师 2012 年 4 月 24 日 #411 刘军 实验学时 4 实验目的及要求 类 别 上机表现 报告质量 说明: 1.实验目的: (1)进一步熟悉高级语言编程 (2)掌握使用Apriori算法从事物数据库中挖掘频繁项集的方法;掌握使用ID3算法对任意元组进行分类;掌握使用k-means算法给每一类帖上标签。 成 绩 评 定 表 评 分 标 准 按时出勤、遵守纪律 认真完成各项实验内容 程序代码规范、功能正确 填写内容完整、体现收获 分值 30分 得分 70分 合 计 评阅教师: 刘军 日 期: 2012 年 月 日 如何设置系统数据源名称(DSN) 1. Microsoft? Windows NT? 4.0 用户:单击“开始”按钮,指向“设置”,单击“控制面板”,然后

双击“数据源 (ODBC)”。 2. Windows? 2000 用户:单击“开始”按钮,指向“设置”,单击“控制面板”,然后双击“管理工具”,

再双击“数据源 (ODBC)”。

3. 在“系统 DSN”选项卡上单击“添加”按钮。

4. 选择“Microsoft Access 驱动程序 (*.mdb)”,然后单击“完成”按钮。 5. 在“数据源名”框中,输入“教程”,然后在“数据库”下,单击“选择”。

6. 在“选择数据库”对话框中,浏览到“C:\\Program Files\\Microsoft Analysis

Services\\Samples”,然后单击“FoodMart 2000.mdb”。单击“确定”按钮。

7. 在“ODBC Microsoft Access 安装”对话框中单击“确定”按钮。 8. 在“ODBC 数据源管理器”对话框中单击“确定”按钮。

如何启动 Analysis Manager

?

单击“开始”按钮,依次指向“程序”、“Microsoft SQL Server”和“Analysis Services”,然后单击“Analysis Manager”。

如何建立数据库结构

1. 在 Analysis Manager 树视图中展开“Analysis Servers”。 2. 单击服务器名称,即可建立与 Analysis Servers 的连接。 3. 右击服务器名称,然后单击“新建数据库”命令。

4. 在“数据库”对话框中的“数据库名称”框中,输入“教程”,然后单击“确定”按钮。 5. 在 Analysis Manager 树窗格中展开服务器,然后展开刚才创建的“教程”数据库。 新的“教程”数据库包含下列项目:

? ? ? ? ?

数据源

多维数据集 共享维度 挖掘模型 数据库角色

然后,建立到“教程”数据源中的示例数据的连接。教程中的全部练习都将使用这个示例。 在 Analysis Manager 中建立一个数据源,将数据库连接到在 ODBC 数据源管理器中建立的系统数据源名称 (DSN) 上。在建立多维数据集的过程中,所有的数据都将来自这个源。

如何建立数据源

1. 在 Analysis Manager 树窗格中,右击“教程”数据库下的“数据源”文件夹,然后单击“新数据源”

命令。

2. 在“数据链接属性”对话框中,单击“提供者”选项卡,然后单击“Microsoft OLE DB Provider for

ODBC Drivers”。

3. 单击“连接”选项卡,然后从“使用数据源名称”列表中单击“教程”。

4. 单击“测试连接”以确保一切工作正常。在“Microsoft 数据链接”对话框中应出现一条消息,说明

连接成功。在消息框中单击“确定”按钮。

5. 单击“确定”按钮关闭“数据链接属性”对话框。

如何打开多维数据集向导

?

在 Analysis Manager 树窗格中,“教程”数据库下,右击“多维数据集”文件夹,单击“新建多维数据集”菜单,然后单击“向导”命令。

如何向多维数据集添加度量值

度量值是要进行分析的数据库中的量化值。常用的度量值为销售、成本和预算数据。度量值根据多维数据集不同的维度类别进行分析。

1. 在多维数据集向导的“欢迎”步骤,单击“下一步”按钮。

2. 在“从数据源中选择事实数据表”步骤,展开“教程”数据源,然后单击“sales_fact_1998”。 3. 单击“浏览数据”按钮可以查看“sales_fact_1998”表中的数据。数据浏览完毕后,关闭“浏览数据”

窗口,然后单击“下一步”按钮。

4. 若要定义多维数据集的度量值,在“事实数据表数据列”下,双击“store_sales”。对“store_cost”

和“unit_sales”列重复此步骤,然后单击“下一步”按钮。

如何建立时间维度

1. 在向导的“选择多维数据集的维度”步骤,单击“新建维度”命令。此操作将调用维度向导。

2. 在“欢迎”步骤,单击“下一步”按钮。

3. 在“选择维度的创建方式”步骤,选择“星型架构:单个维度表”选项,然后单击“下一步”按钮。

4. 在“选择维度表”步骤,单击“time_by_day”。单击“浏览数据”按钮可以查看包含在

“time_by_day”表中的数据。 查看完“time_by_day”表后,单击“下一步”按钮。 5. 在“选择维度类型”步骤,选择“时间维度”选项,然后单击“下一步”按钮。

6. 接下来,将定义维度的级别。在“创建时间维度级别”步骤,单击“选择时间级别”,单击“年、季度、

月”,然后单击“下一步”按钮。

7. 在“选择高级选项”步骤,单击“下一步”按钮。

8. 在向导的最后一步,输入“Time”作为新维度的名称。

注意: 使用“与其它多维数据集共享此维度”复选框,可以指定此维度是共享的,还是专用的。该复选框位于屏幕的左下角。 保持该复选框的选中状态。

7. 单击“完成”返回到多维数据集向导。

8. 在多维数据集向导中,现在应能在“多维数据集维度”列表中看到“Time”维度。

如何建立产品维度

1. 再次单击“新建维度”命令。在“欢迎进入维度向导”步骤,单击“下一步”按钮。 2. 在“选择创建维度的方式”步骤,选择“雪花架构: 多个相关维度表”选项,然后单击“下一步”按钮。 3. 在“选择维度表”步骤,双击“Product”和“product_class”将它们添加到“选定的表”。单击“下一

步”按钮。

4. 在维度向导的“创建和编辑联接”步骤,显示在上一步选定的两个表以及它们之间的联接。单击“下

一步”按钮。

本文来源:https://www.bwwdw.com/article/222h.html

Top