(数据仓库多维数据组织与分析)
更新时间:2023-05-13 05:07:01 阅读量: 实用文档 文档下载
一、实验内容和目的
目的:
1.理解维(表)、成员、层次(粒度)等基本概念及其之间的关系;
2.理解多维数据集创建的基本原理与流程;
3.理解并掌握OLAP分析的基本过程与方法;
内容:
1.运用Analysis Server工具进行维度、度量值以及多维数据集的创建(模拟案例)。
2.使用维度浏览器进行多维数据的查询、编辑操作。
3.对多维数据集进行切片、切块、旋转、钻取操作。
二、所用仪器、材料(设备名称、型号、规格等)
操作系统平台:Windows 7
数据库平台:SQL Server 2008 SP2
三、实验原理
在数据仓库系统中,联机分析处理(OLAP)是重要的数据分析工具。OLAP的基本思想是企业的决策者应能灵活地、从多方面和多角度以多维的形式来观察企业的状态和了解企业的变化。
OLAP是在OLTP的基础上发展起来的,OLTP是以数据库为基础的,面对的是操作人员和低层管理人员,对基本数据的查询和增、删、改等进行处理。而OLAP是以数据仓库为基础的数据分析处理。它具有在线性(online)和多维分析(multi-dimension analysis)的特点。OLAP超越了一般查询和报表的功能,是建立在一般事务操作之上的另外一种逻辑步骤,因此,它的决策支持能力更强。
建立OLAP的基础是多维数据模型,多维数据模型的存储可以有多种不同的形式。MOLAP和ROLAP是OLAP的两种主要形式,其中MOLAP(multi-dimension OLAP)是基
于多维数据库的OLAP,简称为多维OLAP;ROLAP(relation OLAP)是基于关系数据库的OLAP,简称关系OLAP。
OLAP的目的是为决策管理人员通过一种灵活的多维数据分析手段,提供辅助决策信息。基本的多维数据分析操作包括切片、切块、旋转、钻取等。随着OLAP的深入发展,OLAP也逐渐具有了计算和智能的能力,这些能力称为广义OLAP操作。
四、实验方法、步骤
要求:利用实验室和指导教师提供的实验软件,认真完成规定的实验内容,真实地记录实验中遇到的各种问题和解决的方法与过程,并根据实验案例绘出多维数据组织模型及其OLAP操作过程。实验完成后,应根据实验情况写出实验报告。
五、实验过程原始记录(数据、图表、计算等)
本实验以实验一建立的数据仓库为基础,使用Microsoft的SQL Server Business Intelligence Development Studio工具,建立OLAP相关模型,并实现OLAP的一些简单基本功能。
首先打开SQL Server Business Intelligence Development Studio工具,新建一个Analysis
Service项目,命名为:
DW
新建:数据源,连接实验一中建立的数据仓库
新建数据源视图,选择OLAP中要用到的所有表
建立维度表和事实表之间的主外键关系,如下
根据订单主题建立分析维度:发货方式、下单方式、订单状态、订单价值、销售人员、
日期(年月日/年月旬日/年季月日/年月周日)、客户(年龄/性别/客户类型/所在地区/年收入/职称/受教育程度/婚姻状况/拥有车辆数/子女数量)
以【订单价值】维度为例,说明如下:
选择使用现有表,选择订单价值表:
V_SUBTOTAL_VALUES
选择所有属性,设置维度名称为:订单价值,完成
添加一个层次结构,处理维度,查看效果
显示字段按字符排序,显然不符合习惯,给维度添加一个属性关系,做为字段排序依据,重新处理后查看效果
其他各维度建立完成后效果如下(部分):
建立多维数据集,确定度量值(修改相应度量值的显示名称),选择已经建好的维度
OLAP模型建立完成,如下为对多维数据集进行切片、切块、旋转、钻取的操作示例 切片【订单价值-订单数量】
切块【订单价值-订单数量-客户受教育程度】
旋转【订单价值-订单数量-客户受教育程度 客户受教育程度-订单数量-订单价值】
钻取【客户所在地区:国家 省 市-订单数量】
六、实验结果、分析和结论(误差分析与数据处理、成果总结等。其中,绘制曲线图时必须用计算纸)
通过本次实验,我们理解了OLAP的多维数据分析的概念,简单实现了一个多维数据分析模型,对多维数据分析的基本操作(切片、切块、钻取、旋转)有一个基本的认识。同时,在进行模型建立过程中,因为建立数据仓库过程中数据导入问题,需要我们重新检查数据仓库的ETL过程,寻找问题并予以解决,这一过程是一个循环往复的过程,直至所有问题都得以解决,OLAP的多维数据集才能顺序建立并进行相关操作,所以在ETL过程中认真细心,尽量考虑周全,可以避免建立OLAP多维数据集时的很多问题。
实验步骤:
1 在sql server managementstudio中附加数据库adventureworkR2。查看数据表(事实表,维表)
2 在bussiness intelligence中建立数据仓库项目,事实表:factinternetsales 维表:date,customer,geography,product 3 部署运行,进行OLAP操作。
正在阅读:
(数据仓库多维数据组织与分析)05-13
人生·感恩作文(优秀10篇)03-27
智能化弱电集成施工组织设计方案最全完整版10-07
学生党支部工作计划【优秀8篇】03-23
黄帝内经-最新问题答案11-01
2014-2019年中国耳机行业市场分析及发展前景预测报告03-23
第 12 课 我来看昆虫05-28
《步步高 学案导学》2013-2014学年高中物理(人教版 选修3-3)同步课时检测第八章 气体 章末检测-最新学习09-29
看看自已是什么命11-24
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 互联网+数据中心行业分析报告
- 2017上海杨浦区高三一模数学试题及答案
- 招商部差旅接待管理制度(4-25)
- 学生游玩安全注意事项
- 学生信息管理系统(文档模板供参考)
- 叉车门架有限元分析及系统设计
- 2014帮助残疾人志愿者服务情况记录
- 叶绿体中色素的提取和分离实验
- 中国食物成分表2020年最新权威完整改进版
- 推动国土资源领域生态文明建设
- 给水管道冲洗和消毒记录
- 计算机软件专业自我评价
- 高中数学必修1-5知识点归纳
- 2018-2022年中国第五代移动通信技术(5G)产业深度分析及发展前景研究报告发展趋势(目录)
- 生产车间巡查制度
- 2018版中国光热发电行业深度研究报告目录
- (通用)2019年中考数学总复习 第一章 第四节 数的开方与二次根式课件
- 2017_2018学年高中语文第二单元第4课说数课件粤教版
- 上市新药Lumateperone(卢美哌隆)合成检索总结报告
- 多维
- 数据
- 仓库
- 组织
- 分析
- 中国海洋大学食品考研生物化学2000-2010真题
- 碳酸氢钠溶液耳道冲洗与联合用药治疗真菌性外耳道炎的效果联合研究100
- 2008年4月全国自考现代管理学试题
- 中石油中石化争食非油业务 加油站探路超级零售连锁
- CAD三维转二维的详细方法
- 变量定义与声明的区别
- 食品添加剂习题2多选题
- 剑桥通用五级考试KET 分类词汇识记表
- 分数四则混合运算和应用题复习(一)
- 1.1原子结构第一课时学案
- 六年级数学圆的认识3
- 01-03 配置逻辑接口
- 面试常见智力题解答
- 认证产品一致性控制及变更程序
- 二次函数的实际应用题(武汉三初上课)
- 扛得住,世界就是你的
- The type I interferon system in the etiopathogenesis of autoimmune diseases
- 丰田卡罗拉使用手册(说明书)1
- 辩论赛网络使人疏远资料
- 新型缩醛型阴离子表面活性剂的合成