数据挖掘实验1
更新时间:2023-09-14 23:17:02 阅读量: 资格考试认证 文档下载
武 汉 工 程 大 学
计算机科学与工程学院
《数据仓库与数据挖掘》实验报告[1]
专业班级 学生学号 学生姓名 实验项目 实验类别 09信技03 0905060322 张东梅 数据仓库的基本操作及多维数据的组织与分析 操作性 实验时间 实验地点 指导教师 2012 年 4 月 24 日 #411 刘军 实验学时 4 实验目的及要求 类 别 上机表现 报告质量 说明: 1.实验目的: (1)进一步熟悉高级语言编程 (2)掌握使用Apriori算法从事物数据库中挖掘频繁项集的方法;掌握使用ID3算法对任意元组进行分类;掌握使用k-means算法给每一类帖上标签。 成 绩 评 定 表 评 分 标 准 按时出勤、遵守纪律 认真完成各项实验内容 程序代码规范、功能正确 填写内容完整、体现收获 分值 30分 得分 70分 合 计 评阅教师: 刘军 日 期: 2012 年 月 日 如何设置系统数据源名称(DSN) 1. Microsoft? Windows NT? 4.0 用户:单击“开始”按钮,指向“设置”,单击“控制面板”,然后
双击“数据源 (ODBC)”。 2. Windows? 2000 用户:单击“开始”按钮,指向“设置”,单击“控制面板”,然后双击“管理工具”,
再双击“数据源 (ODBC)”。
3. 在“系统 DSN”选项卡上单击“添加”按钮。
4. 选择“Microsoft Access 驱动程序 (*.mdb)”,然后单击“完成”按钮。 5. 在“数据源名”框中,输入“教程”,然后在“数据库”下,单击“选择”。
6. 在“选择数据库”对话框中,浏览到“C:\\Program Files\\Microsoft Analysis
Services\\Samples”,然后单击“FoodMart 2000.mdb”。单击“确定”按钮。
7. 在“ODBC Microsoft Access 安装”对话框中单击“确定”按钮。 8. 在“ODBC 数据源管理器”对话框中单击“确定”按钮。
如何启动 Analysis Manager
?
单击“开始”按钮,依次指向“程序”、“Microsoft SQL Server”和“Analysis Services”,然后单击“Analysis Manager”。
如何建立数据库结构
1. 在 Analysis Manager 树视图中展开“Analysis Servers”。 2. 单击服务器名称,即可建立与 Analysis Servers 的连接。 3. 右击服务器名称,然后单击“新建数据库”命令。
4. 在“数据库”对话框中的“数据库名称”框中,输入“教程”,然后单击“确定”按钮。 5. 在 Analysis Manager 树窗格中展开服务器,然后展开刚才创建的“教程”数据库。 新的“教程”数据库包含下列项目:
? ? ? ? ?
数据源
多维数据集 共享维度 挖掘模型 数据库角色
然后,建立到“教程”数据源中的示例数据的连接。教程中的全部练习都将使用这个示例。 在 Analysis Manager 中建立一个数据源,将数据库连接到在 ODBC 数据源管理器中建立的系统数据源名称 (DSN) 上。在建立多维数据集的过程中,所有的数据都将来自这个源。
如何建立数据源
1. 在 Analysis Manager 树窗格中,右击“教程”数据库下的“数据源”文件夹,然后单击“新数据源”
命令。
2. 在“数据链接属性”对话框中,单击“提供者”选项卡,然后单击“Microsoft OLE DB Provider for
ODBC Drivers”。
3. 单击“连接”选项卡,然后从“使用数据源名称”列表中单击“教程”。
4. 单击“测试连接”以确保一切工作正常。在“Microsoft 数据链接”对话框中应出现一条消息,说明
连接成功。在消息框中单击“确定”按钮。
5. 单击“确定”按钮关闭“数据链接属性”对话框。
如何打开多维数据集向导
?
在 Analysis Manager 树窗格中,“教程”数据库下,右击“多维数据集”文件夹,单击“新建多维数据集”菜单,然后单击“向导”命令。
如何向多维数据集添加度量值
度量值是要进行分析的数据库中的量化值。常用的度量值为销售、成本和预算数据。度量值根据多维数据集不同的维度类别进行分析。
1. 在多维数据集向导的“欢迎”步骤,单击“下一步”按钮。
2. 在“从数据源中选择事实数据表”步骤,展开“教程”数据源,然后单击“sales_fact_1998”。 3. 单击“浏览数据”按钮可以查看“sales_fact_1998”表中的数据。数据浏览完毕后,关闭“浏览数据”
窗口,然后单击“下一步”按钮。
4. 若要定义多维数据集的度量值,在“事实数据表数据列”下,双击“store_sales”。对“store_cost”
和“unit_sales”列重复此步骤,然后单击“下一步”按钮。
如何建立时间维度
1. 在向导的“选择多维数据集的维度”步骤,单击“新建维度”命令。此操作将调用维度向导。
2. 在“欢迎”步骤,单击“下一步”按钮。
3. 在“选择维度的创建方式”步骤,选择“星型架构:单个维度表”选项,然后单击“下一步”按钮。
4. 在“选择维度表”步骤,单击“time_by_day”。单击“浏览数据”按钮可以查看包含在
“time_by_day”表中的数据。 查看完“time_by_day”表后,单击“下一步”按钮。 5. 在“选择维度类型”步骤,选择“时间维度”选项,然后单击“下一步”按钮。
6. 接下来,将定义维度的级别。在“创建时间维度级别”步骤,单击“选择时间级别”,单击“年、季度、
月”,然后单击“下一步”按钮。
7. 在“选择高级选项”步骤,单击“下一步”按钮。
8. 在向导的最后一步,输入“Time”作为新维度的名称。
注意: 使用“与其它多维数据集共享此维度”复选框,可以指定此维度是共享的,还是专用的。该复选框位于屏幕的左下角。 保持该复选框的选中状态。
7. 单击“完成”返回到多维数据集向导。
8. 在多维数据集向导中,现在应能在“多维数据集维度”列表中看到“Time”维度。
如何建立产品维度
1. 再次单击“新建维度”命令。在“欢迎进入维度向导”步骤,单击“下一步”按钮。 2. 在“选择创建维度的方式”步骤,选择“雪花架构: 多个相关维度表”选项,然后单击“下一步”按钮。 3. 在“选择维度表”步骤,双击“Product”和“product_class”将它们添加到“选定的表”。单击“下一
步”按钮。
4. 在维度向导的“创建和编辑联接”步骤,显示在上一步选定的两个表以及它们之间的联接。单击“下
一步”按钮。
正在阅读:
数据挖掘实验109-14
光学元件的疵病检验与研究现状05-20
《人体运动能力检测与评定》05-28
校园的一角真美作文500字07-10
《商业银行经营管理》单选题10-10
父爱让我感动作文800字06-26
信息技术试题及答案05-27
(九个必须)研讨发言材料03-27
金融危机下我国科技创新的八大使命资料06-12
- 梳理《史记》素材,为作文添彩
- 2012呼和浩特驾照模拟考试B2车型试题
- 关于全面推进施工现场标准化管理实施的通知(红头文件)
- 江西省房屋建筑和市政基础设施工程施工招标文件范本
- 律师与公证制度第2阶段练习题
- 2019-2020年最新人教版PEP初三英语九年级上册精编单元练习unit6训练测试卷内含听力文件及听力原文
- 小升初数学模拟试卷(十四) 北京版 Word版,含答案
- 认识创新思维特点 探讨创新教育方法-精选教育文档
- 00266 自考 社会心理学一(复习题大全)
- 多媒体在语文教学中的运用效果
- 派出所派出所教导员述职报告
- 低压电工作业考试B
- 18秋福建师范大学《管理心理学》在线作业一4
- 中国铝业公司职工违规违纪处分暂行规定
- 13建筑力学复习题(答案)
- 2008年新密市师德征文获奖名单 - 图文
- 保安员培训考试题库(附答案)
- 银川市贺兰一中一模试卷
- 2011—2017年新课标全国卷2文科数学试题分类汇编 - 1.集合
- 湖北省襄阳市第五中学届高三生物五月模拟考试试题一
- 数据挖掘
- 实验
- 12319数字城管指挥中心岗位职责与日常管理制度
- 美国概况
- 2015年10月自考英语二考试试题及答案
- 必修2.1.1.3简单组合体的结构特征
- 市公安局机关党委2010年党建工作总结
- 2014年银行从业资格《个人贷款》考前突破试卷第二部分
- 一下数学重要练习(聪明小屋) - 图文
- 关于印发綦江县电力事故灾难应急预案的通知 - 图文
- 刑事诉讼法练习题4
- ZXTR - RNC设备试题整理
- 人教版四年级语文下册《尊严》教学设计,语文教案设计
- 3013年新分工重点工程-宁德市质量技术监督局 - 图文
- 苏一光A20GPS接收机操作说明书 - 图文
- 影响线习题及答案
- 课外辅导记录语文二年级
- C++函数、数组及指针章习题指导
- ZL-SMP-10-019-00产品质量回顾分析管理程序
- 重庆市大渡口区社区工作者面试题目3题
- 2014年北师版数学第七册第四单元《运算律》教学设计
- 宁波柯力D2008F系列使用说明书