基于Oracle数据仓库应用技术的研究与实现

更新时间:2023-05-14 12:52:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

本文介绍了数据仓库系统的设计与实现方法。

武汉科技大学硕学论士位文摘要

一 1第页

数据仓库是一项基于数据管理和利用的综合性技术。 近年来,数据仓库技术在信息技术领域中日益成熟,己成为业界研究的重点。企业要想在市场竞争中取胜,获得更大的经济效益,可以利用数据仓库技术,对企业的业务数据进行深层次的挖掘、分析历史和当前的业务数据以及相关环境的数据,快速获取其中有用的决策信息,为企业提供快速、准确和方便的决策支持。

数据仓库是面向主题的、 集成的、变的时和非易失的数据集合,支持管理的决策过程。数据仓库不是一个新的平台,而是一个新的概念。数据仓库也不是一个现成的产品,而是一个解决方案。数据仓库是在收集各种分散、异构数据源的基础上,对数据进行转换和集

成,从而为决策者提供单一的分析环境,帮助其进行科学决策。

联机分析处理( Ln A ltc1 rcsigOA) O一ie ayia Poesn,Lp是数据仓库的一个典型的应用。 n n它能将数据仓库中的数据按照不同的粒度级进行聚合和预计算,从而在用户面前展现多维

数据视图。同时,联机分析处理还提供了较直观的多维分析操作,包括切片、切块、上卷、下钻和旋转等,使用户能多角度、多层次地观察数据仓库中的数据。本论文对面向决策支持的数据仓库技术进行了深入的研究,利用数据仓库和联机分析 处理的相关知识,独立设计了钢铁销售决策支持的数据仓库系统的架构,建立了数据仓库系统,并在此基础上进行应用研究。本文阐述了 数据仓库的基本概念及特点、数据仓库的体系结构、数据仓库的数据组织、数据仓库的数据分析等知识,介绍了oal公司提供的 rce基于 oal g数据仓库解决方 rce i案及其关键工具,在对本文的理论基础进行了详细的介绍后,研究了如何将数据仓库及联机分析处理有关理论、方法应用于决策支持系统中.完成的主要工作有:结合钢材销售主业务,构建数据仓库模型,划分了合同、销售及来款三个主题,建立

了满足此模型需求OA三层客户/ LP服务器体系结构,进而完成了为销售决策提供支持的数据仓库环境的设计;运用O工具实 B w现了部分系统需求数据的 T转换;为了 E L在两维的屏幕中显示多维数据,运用了最新的oal uiesltli ne ol中的 lcvrr r ceBsns nelg c Tos nsoee及 e相关工具,实现了 LP O多维分析操作; A

设计了 oal数据仓库的应用模型,基于 ce r独立完成了某钢铁公司销售决策支持系统的数据仓库架构设计、建模及OA分析, LP从而实现了数据仓库系统在销售决策中的实际应用。

实践 本文中证明,数据仓库系统的应用模型设计方法及开发步骤,充分利用了 al r oce产品开发出了高效、灵活、实用的 S系统,集, D在实际的推广应用中受到了柳钢销售分析决策人员的一致好评。文中的数据仓库系统的应用模型设计方法、开发步骤及数据表现形式,对基于Oal数据仓库的设计及开发具有一定的参考价值。 re c关键词: al,数据仓库,决策支持系统,数据转换, r oce数据清洗,联机分析处理, w OB

本文介绍了数据仓库系统的设计与实现方法。

第 H页Ab ta t sr C

武汉科技大学硕学论士位文

Ted w os e i q s n e n r ig hu t hi e ii r i yg wn叩 i此肚 ao i nao h a a t r e e c1u sc a g s l 0 n e f n nt o f l n征ho g ad b n e r ahdD w eo犯ia ie av t h l o c l n h e侧d e r e. a a h切 sn n g t e n o n n o, y s a y e l s c t r t ri c o g e y目 isao a即 c o A ee r, h w n twn cm to ad c 1s mn tt n P an n n印 s w c at it o p i n a u irl d l t n ii t i i e h S o e h et i n qr e

e r c o n m,s a u ot a ah eo l m ioe u m e ef d w e叹 tho既 mnd p朋 le sr, m k s h t r o c o i el a h i t e e e%邓 i c o i t ac n adre tn rao a, e r u t n e v i mt ndt助da u u f dci m l l nao la f i n o a c i s u e io a n n n i q茂 e l s n kg f t n o即t a l s dtw hu c P v丘tea ad n e d i s pr o t y o a a os a r i I xC n cv n e o uot m1 a c a e r e n od S t e, oe i c n P t m s o即t r& e i pe rs Te a、 r si a u e一 n d访e t, m vn n nv aeoetn v e ues sb co et, t a dt一aa ad n l lclco七 dt a h a o jt r e i r g ei e t n oo t i i

o d isP ro m g

e, ci m n P c sD w eo i int n f a n upt f a t o n a e nd i m t es n o面 g r s a a hul s o a e o . t r sg e w P tr, u a e cne . aw l ti o aP dc bt ouo. P v e lf a m bt n o P Me lei sn o w ct n l l t r ut u ast n I r i s o, l i t ods io a r dci m e a s g aa s ev n成 sn k - i 1 nl i ni m ne ys o re n h i w i if ao台 m m l l h c n rt n o o i m u Pe i t

he g e s u ei a f nd dn g t ia娜 e d r ia h叹 . er n us ss n ne a i re n d to o o e c r仃s o n t a d y a se n w o e n t d a o e r n L e y ar e i O一 n A l c P c s O A ial i P i n f aa o n O a il o s (L )s c saa lao o dtw h i f i n t g n P s l a c Pc i t a r e s ug re h n r t ea l i t 1e cv na s fm t i ni ta i y so u ime o dt o ae gau ts Mo oe O A l d s n aa fv d rn 1 l . r v( L P l a i r画 e e

s pr s m tie i aa 1i oe i, h s ederl, l o ad P S m uim oln yc Pr o s a l,l, l d l w n uot o e ld n n a a a n u s i co一 r一n S tl t S c c P ui d r抓,h h r i u r i t fx i tv d fmd r p s cv o e i P v s s th i il oi a r i e e P t s公 w c o de wh e e eb i y t w a e t o f n re e e i i i h’ pe T s即 r ose a nt a a hu t h 1 r n dd io u t de r e ho h d w eo e c o g Oe e esns即r sr i e t r S en o i t c i P y M i ue f k0 l g od w r o e d L Pd i s dtw e u s m k g a ns ot lwe e fa a hu a 0 A e g t a ahs y e h 1 d t esn, s h a r oe s n e e t丘的w rs pId d io oslnr ad e1 u i e ne y y a hr田 e k u o t esn fe o i n S l ds n P d n b t u o o

p’ h ci e t e l o n e t n td e t y r l e h l,曲dm l e s d w hu s t a o t伍 w r t n a s a lao i e n a a a o sy e s n h叨e k h m et P i n P mt t r e e smb e e d o,e k h P t e c ieex ho h s o iai . rsac ntic mbn t n o

h P eir c it e n P d Tea r td s r1h o e n b aes, s m丘叮, t r i f nouefs t c c a c叮c r is e a e a o加 z o P y t tt y ic t J da g n g dt a h s aw U t m ot俪 qeob ln da ahu s t, c l a w e u, e ah a e a r o es se j c u fud g tw叮 o e s s n y r s l ia e s ye e d, m o xla t k t s d ePc s e y o a t Wy r oere od w hu g b 0 c b e it h e o n h ate v p C f a a osi y rla d e f e o s l J o t ae tr ev n e ae s n rl叭 tn os s h n o oae, edere co t wy aP t ko1 g odtw e u ad c h e a r e h atP 1h n we e fa a h s n o y e d a r o eO A ti l me D St n lw r c b sn力n afUw n: L P mP n S . O n k a e uua z so o ig o e i e h a o n eR a zsh d t ae s mo e a h h e i l t le a vxhu e d l dtet e一e cin adsre丘 e o o 0L e ie l a、 o n r r e n evr a w r f AP m k

i t a尔n h o l m k h u c c S s g t m d, d aetes e, n叭 s e seu e ad aen se e e a n sr b t o j s t r u C a s cn ghng氏 j, b t l bt j t j u e h r o ash e g f a w e s r d ei n a g t州owrm et s n oda ahu p v ndc o m n. k k e t i t r o e oi i g i i a- k G t d r T P c s i h r1W eo B lr a fmE L r e wtt 0a e址 hue ud ip . s te t eh a O o s h e c s le n r t U s l t s e f哪 e un sn1 e o l e zn 1l s io r oo lB i s

1ein To tr i ay2 g eh t st a Dc r e e e v s e tl c g e s a o l e in m t m snlP a0 o0 A io ets wm I ie 1 d ito ie i ud e i aoetn f L P r r h u1mn o a n w一m o i no i r1 nd o o t d sn t l a a d n n s a l即 re。 e n

Ds t 即pc i m dlf a w hu b e n0那l i l e t da eg h i e s n lao oeo dta as a do r em e n h a i n t a e r es, P m te t sw eo e yt fme r adm dl d a s o 0 A te e i s aPi i o r s a hu ss m t w k n e a o oea a 1 i f L n n ys, P hnr z t P1ao f l ae h e c n t

本文介绍了数据仓库系统的设计与实现方法。

武汉科技大学硕学论士位文

第m页

山 a hu s t u n dci m i o slgt1a inn p dny恤w eo y ms pi e io an n e i se n r i e e 1 r s s P n e e o g sn kg - l n es do d n t e . nr t, IP c优 h S c t w t D S ad i即 laom ea P ai e e r e t Pci eln r h i n d t d o od a a hu ds e s e c f出 w eo eegd r s i n nh a r i i i e f b a u f, n u u f r e o, s o d it Pp,h hsf i,eie d e l欧I fl oo lt lgt go e e w c e cn l ln s u m g l s t x e c a o sea此 a b d i n ae oLU H US ES N R NC R O订1Nia lao. m y es一 k fIZ O住 L A DIO O凡 0 n P i n k r ci m r o s P Pc i t Te e 0 oapci m d ad P e odtw e u S b m t d fp1 o o e n t r s fa a hs y hs i n t a l h o s e C a x 0 e雍mit p r v nh a l e e p sr e ys f o e g n t mP m nda, eo bs o r e ue tds ad i l et t、丁hue a d o l. l u i n o e a a s e n a c K州 od: al D W址 hu, S, a T出 fr, a Ce i, L PO e rsO c e a r,t eo D SD r招 m D e s t o t l n O A WB s n a g,

本文介绍了数据仓库系统的设计与实现方法。

武汉科技大学硕学论士位文第一章绪论

本章介绍了论文的选题背景、研究内容和 工作,给出了并文章的结构安排。 11 .本课题的选题来源

第1页

随着计算机技术的飞速发展和业界不断提出 新的需求,数据仓库技术应运而生。现在,愈来愈多的企业认识到,企业要想在竟争中取胜,更大的收益,获得必须利用数据仓库技术,深层次地挖掘、分析历史和当前的生产业务数据,以及相关环境的相关数据,自快动速获取其中有用的决策信息,为企业提供快速、准确和方便的决策支持。数据仓库是一项基于数据管理和利用的综合性技术和解决方案,它已成为数据库市场的新一轮增长点,同时也成为下一代信息管理应用系统的重要组成部分。

柳钢经销公司 商贸流通量大,商业结构较复杂,有大量的进销存业务数据和特定的决策分析需求。原已开发的柳钢经销网络信息管理系统中的报表,提供决策分析信息已捉襟见肘。数据仓库技术在商贸流通领域己经广泛的应用,柳钢经销公司提出了建设基于数据仓库的销售决策支持系统的要求。

本课题应用数据仓库、联机分析处理( A) 0 P理论和 L技术、 al产品 r oce集以及柳钢经销公司己有的销售数据资源,设计并开发出用性较强的、了实基于 oal数据仓库的 rce钢材销售决策支持系统,为公司高层管理人员提供了决策支持.在国内 钢铁销售行业中,基于数据仓库的钢铁销售决策系统为数不多。希望本文中基于 oal数据仓库的应用模型设计与实现方对设 rce法,计与开发基于 oal数据仓库钢铁 rce销售决策系统以及相关应用系统,可以起到抛砖引玉的作用 .

1 . 2本文主要研究内容和工作本文主要研究内 容包括面向决策支持的数据仓库的体系结构、数据组织、数据模式、设计与实现及数据仓库相关应用。本文分析了 面向决策支持的数据仓库技术 O P和 L相关知识, A研究了如何使用数据仓库技术来设计并实现数据仓库的应用.根据数据仓库及 O P相关知 L的 A识,借助 oal数据 rce仓库产品集,独立设计了柳州钢铁公司销售提供决策支持的数据仓库系统的架构,并在数据仓库架构基础上建立了面向销售主题、来款主题、合同主题的数据仓库模型,依据数据仓库模型建立了数据仓库系统,实现了钢铁销售决策支持系且给出了统,相关运行效果图.主要工作有:

1配置数 .据仓库系统设计、开发及运行环境

,并使oal数据库和 oal工具集协 rce rc e调工作:调研并分析柳钢销售决策信息需求、各个产品销售站分析统计信息需求,同时整合待分析的信息,明确设计和开发的具体内制定有效方案。容并 2结合柳 钢销 .售公司钢材销售主业务,划分了合同、销售及来款三个主题,数据构建仓库模型以确定系统中各个主题对应的维表和事实表的逻辑结构和物理结构,建立了满足此模型需 L三层客户/求OA P服务器体系结构,进而完成了为销售决策提供支持的数据仓库

本文介绍了数据仓库系统的设计与实现方法。

第2页环境的设计。

武汉科技大学硕学论士位文

3选择适当的数据 .组织形式, oBoal梅rh s B le)运用 ( ce e oe u d工具结合数据 w r u i r仓

库型计生并署据库统各象实维(mn n立体( e映模设、成部数仓系中对体 D s )方 C) i i、 e o b u及射伽 p g,过 B的射行 L t t a o o )换以入据 Pn等 ai)通 o中映进 E E a一n r a转导数到 w T x c T s矿L ( r r f d事实表和维表中,从而生成完整的数据仓库。 4 .运用最新的 al ui s nelgne ol工具集中的Dsoee及相关 r o ceBs esl liec Tos n t icvr r工具并结合 LP OA特征,开发具有O P A L特征的柳钢销售决策支持系统,为柳钢销售公司高层管理人员提供决策支持。本文中的钢材销售决策支持系统,不仅实现了 LP OA多维分析操作及在两维的屏幕中显示多维数据,同时具有高效、灵活、交互的操作界面.实践证明, 借助于 o。产品可缩短数据仓库系 r l ae集,统应用模型的设计周期,提高开发工作效率。笔者利用 O ce产品集和 a rl柳钢已有的销售数据资源,设计并开发的钢材销售决策支持系统,为柳钢销售公司高层管理人员提供了有效的决策支持。该方法对设计与开发基于oal数据 r。 e仓库的相关应用系统具有一定的参考价值。 3本文的组织和结构论文各章节内容安排如下:

第一章: 绪论论述了论文研究的背景和选题来源、研究内容和工作。中大型钢铁公司所属销售公司是商贸流通量很大的行业,在销售公司中实施基于数据仓库的决策分析系统是一个必然的趋势 .

第二章:数据 仓库技术介绍了仓库理论、数据数据仓库概念和特点、数据仓库体系及系统结构、

数据仓库系统设计方法和具体步骤、数据仓库的数据分析以及建设数据仓库的关键技术。

第三章: al i据仓库解决方论述实现 oal数据仓库及展现分析结果常 rceg数 o案 rce用的工具。

第四章:数据仓 库的实施详细介绍了建设基于钢铁销售主题的数据仓库模型的过程,依据模型设计、生成、部署数据仓库实进行数据转移,体,形成数据仓库,用各种OA L P方法对数据仓库的数据进行分析,并实现了O八前端展现的多维分析和图表展现。 LP第五章:总结和 展望介绍了本系统的总论文创新之处,结、需要完善之处和下一步的工作重点。

本文介绍了数据仓库系统的设计与实现方法。

武汉科技大学硕学文士位论第二章数据仓库技术

第 3页

本章介绍 了数据仓库及相关内容的基本概念、特点、关键技术以及数据仓库的体系结

构、公认的设计数据仓库系统 cD方 Ls法,数据仓库设计的一般步骤,数据仓库的数据分析。本章内容是数据仓库设计和开发的基础。

21 .数据库到数据仓库数据仓库是计算机和数据应用到一定阶段的必然产物,是基于传统数据库技术的现代

企业解决方案。传统的数据库系统作为数据管理手段,从它诞生开始,就主要用于事务处理.它是以单一的数据资源,即以数据库为中心,进行事务处理 ( T、批处理到决策分 O P L)

析等各种类型的数据处理工作。经过数据的日积月累,在这些数据库中己经保存了大量的日常业务数据。然而,如今信息部门的工作重点己不在于简单的数据收集,而是使信息系

统的研制从围绕加工数据的程序为中心转变到围绕共享的交互地、方便有效地从现有的大量杂乱无章的数据中获取有意义的信息,从而帮助决策者正确进行企业决策并发掘企业的竞争优势。 LP联机事务处理)与OT (系统的操作型处理环境不同,这类业务的特点是需要大量的历史数据和汇总数据,是基于 OA( LP联机分析处理)析型的分环境。数据库技术的发展为解决决策问题提供了可能,而激烈的市 场竞争产生了对决策支持系统( )大需求, D的巨 s S而一般的事务处理环境不适宜 D应用, S s主要有以下原因叭(事务 处理和分析处理的性能特性不同。 ) 1

在事务处 理环境中,用户的行为特点是数据的存取操作频率高而每次操作处理的时间短:在分析处理环境中,用户的行为模式与此完全不同,某个 D应用程序可能需

S要连续几个小时,从而消耗大量的系统资源。将具有如此不同处理性能的两种应用放在同一个环境中运行显然是不适当的。 ()数据集成问题。 2

D需要 S s集成的数据。全面而正确的数据是有效的分析和决策的首要前提,相关数据收集得越完整,得到的结果就越可靠。当前绝大多数企业内数据的真正状况是分散而非集成的。造成这种分散的原因有多种,主要有事务处理应用分散、“蜘蛛网”题、问数据不一致问题、外部数据和非结构化数据。 ()数据动态集成问题。 3

静态集成的 最大缺点在于:如果在数据集成后数据源中数据发生了变化,这些变化将不能反映给决策者,导致决策者使用的是过时的数据。集成数据必须以一定的周期(例如 2小时进行刷新, 4 )称其为动态集成。显然,事务处理系统不具备动态集成的能力。 () 4历史数据问题。事务处理 一般只需当前数据,在数据库中一般也是存储短期数据,且不同数据的保存期限也不一样,即使有一些历史数据保存下来了,也被束之高阁,未得到充分利用。但对于决策分析言历史数据是相当重要的,而,许多分析方法必须以大量的历史数据为依托。

本文介绍了数据仓库系统的设计与实现方法。

第4页

武汉科技大学硕学论士位文

没有历史数据的详细分析,是难以把握企业的发展趋势的。 S对数据在空间和时间的 D广度上都有了更高的要求,而事务处理环境难以满足这些要求。()数据的综合问题。 5

在事务处 统中理系积累了大量的细节数据,一般而言, S并 D不对这些细节数据进行分析。分析前在,往往需要对细节数据进行不同程度的综合。而事务处理系统不具备这种综合能力,根据规范化理论,这种综合还往往因为是一种数据冗余而被加以限制。综上所述要 提高分析和决策的效率和有效性,分析型处理及其数据必须与操作型处理及其数据相分离。必须把分析型数据从事务处理环境中提取出来,按照 D处理的 s S需要进行重新组织,建立单独的分析处理环境,数据仓库正是为了构建这种新的分析处理环境而出现的一种数据存储和组织技术。

虽然数 库与数据库有着紧密的据仓联系,但也有着概念上的区别, 21传统数据表 .是库与数据仓库的比:较l J:表 21 .传统数据库与数据仓库的比较对比内容数据

内容数据目标数据特征数据结构使用频率数据访问量响应时间要求当前值数据库数据仓库

历史的、存档的、纳的、归计算数据面向主题域、管理决策分析应用

面向业务操作程序、重复处理动态变化、按字段更新高度结构化、复杂、适合操作计算高每个事务只访问少量记录以秒为单位计量

静态、不能直接更新、只定时添加适合分析中到低

有的事务要访问大量记录以秒、分钟、甚至小时为计量单位

22数据仓库概念、特点及应用 .

数据仓库 D a aeos) ( t wrhue是一个面向主题的 ( bet oine、集成的 a S jc retd u ) ( tgae、 I ertd相对稳定的( nVltl、随时间 n ) N一oaie o )不断变化(i arat的数据集 Tm eV in)合

] l于持营理中决制过。 t用支经管的策定程,主题是数据归 类的标准,每个主题基本上对应一个宏观分析领域.如对于一个生产商而言,主题域可能是产品、合同、销售商或材料:集成指璐中的数据是从多个不同的数据源获取的,并在进入 D W之前进行必要转换、重新格式化、重新排列及汇总等操作。如统一不同数据来源的数据结构和编码,将原始数据结构从面向应用过程向面向主题、面向决策支持的结构转换:稳定性指数据通常是被批量方式载入和访问的, D环境中并在w不进行一般意义上的数据更新,其数据在进行装载时是以静态快照的方式进行的,当发生后续变化时个新的,一快照记录就会被写入 D; W不同时间昨中的指数据是历史数据的集合‘,〕

对于数据仓库的概念可以从两个层次予以 理解:首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。

本文介绍了数据仓库系统的设计与实现方法。

武汉科技大学硕学论士位文

第5页

数据仓库是一种概念, 不是一个产品,它包自。括电子邮件文档、语音邮件文档、DR、 C o -M多媒体信息以及其它还未考虑到的数据囚数据仓库最根本的特点是要物理存放数据,这 .些数据并非最新的、专用的,而是源于其它数据库的。数据仓库的建立并不是要取代数据库,而是要建立在一个较全面和完善的信息应用的基础上,用于支持高层决策分析。数据仓库是数据库

技术的一种新的应用,它还需要数据库管理系统来管理数据仓库中的数据。

. .数库 圈2据仓[ 1] .( )数据仓库的数据是面向主题的一

数据仓库中的数据面向 主题,与传统数据库面向应用相对应。主题是一个在较高层次上将数据综合、归类并分析的抽象,每一个主题对应一个宏观的分析领域。面向主题的数据组织方式,在较高层次上对分析对象进行完整、一致的描述,能完整、统一地刻画各个分析对象所涉及的各项数据,以及数据之间的联系。面向主题的数据组织方式是根据分析要求将数据织成一个完备的分析领域,即主题域。主题域有: (独立性,主题域有独 ) 1立内涵,即要求有明确的界限; 2 (完备性,在主 能够 )题内找到分析处理所要求的一切内如果某一分析处理涉及容,到现在主题之外的数据,那么就应当将这些数据增加到该主题中来,从而逐渐完善主题。 ( 库的数二)数据仓据是集成的数据仓库的集成特征是指在数据进入数据 仓库之前,经过数据抽取、数据加工和数据集成,这是建立数据仓库的关键步骤,首先要统一原始数据中的矛盾之处,还要将原始数据结构做一个从面向应用向面向主题的转变。 ( 库的数三)数据仓据是相对稳定的数据仓库的稳定性是指数据仓库反映的是已 成为历史的数据,而不是即时日常事务处理产生的数据。数据经加工和集成进入数据仓库后是极少或根本不修改的,数据仓库是不同时间数据的集合,它要求数据仓库中的数据保存时不仅能满足进行决策分析的需要,而且数据仓库中的数据都要标明该数据的历史时刀期〔。 (数据仓库的 四)数据是随时间不断增加和完善的数据仓库系统需要随着时间的变化不断增 加新的数据内容,如捕捉数据源中已变化的数据并追加到数据仓库中,或是根据这些已变化的数据来更新数据仓库中与其相关的综合数据,以保证数据仓库中分析数据的有效性和正确性。捕捉到的新的变化的数据,过只不又生成一个数据库的快照增加进去,不是对原来的数据的修改,以满足数据的不可更新特

本文介绍了数据仓库系统的设计与实现方法。

第6页

武汉科技大学硕学论士位文

征。综合数据则需要根据这些变化的数据重新进行综合。按照数据的覆盖范围,据仓库 数通常可以分为企业级数据仓库和部门级数据仓库( a

D t a Mr, at数据集市)数据仓库的管理包括数据的。安全、归档、备份、维护和恢复等工作,与目前的 DM的管理工作基本一致。 BS建立数据仓库的目 的是将历史数据和信息按可用的形式和格式提供给用户,利用一系列决策支持工具增加用户对企业数据的分析及利用功能,以便更好地分析数据并做出决策。决策支持过程使用的方法通常分为信息处理、分析处理和数据挖掘;信息处理包括查询、计算和打印报表等;分析处理包括在线分析处理( A; L) O P数据挖掘包括统计分析和知识发现等。

2 . 3数据仓库中的重要概念 2 .元数据 .1 3元数据( aa) td a可以 M t e定义为描述应用系统或业务流程中数据结构及意义的数据或文档,是关于数据的数据,相当于数据库系统中的数据字典。它描述了数据的结构、内容、码、索引等项内容。元数据不仅定义了数据仓库的作用,指明了数据仓库中信息的内容和

位置,刻画了数据的抽取和转换规则,存取数据仓库的主题和相关信息,而且实现了数据

仓的理。库管[ 1 s元数据可以分为两,,。一类是 类【,,,〔川技术元数据( cncleaaa, T hi Mtd )它存储了 e a t关于数据仓库系统技术细节的元数据,主要包括:数据的逻辑模型和物理模型;数据仓库中的表名、字段名、关键字、索引及其相关属性;数据仓库数据与操作环境数据的对应关系和导入、过滤、校验的方法;进行 O分析所用的“和汇总数据的 L P A维”信息;用户和安全性的管理等等。一类是业务元数据 (ui s ea a, Bs n sM d )它保证用户能正确、方 e t a t便的使用数据仓库系统所需的业务术语所表达的数据模型、象名对和属性名;访问数据的原则和数据的来源;系统所提供的分析方法以及公式和报表的信息等等。 232数据集市 ..原始数据从数据仓库流入到不同的部门中以 支持这些部门的定制化使用,这些部门级的数据仓库就称为数据集市呱‘”。一个数据集市就是一个部门的数据体,具有数据仓库的构造基础。数据仓库中的数据处于非常小的粒状级别,而数据集市中的所有数据提供粒状基础。所以对于数据集市来说适合的数据源应该是数据仓库,也就意味着在建立数据集市之前应该建立数据仓库叫。目 前,数据集市主要有两种类型,多维集市( BM)胭DS和通用数据集市.其

中,通用数据集市是由关系技术来支持的并支持星型模式.元数据是数据集市中的一个集成部分,传送到数据集市中的装载程序来创建和更新。 由因为数据仓库是数据集市数据的主要来源,所以数据仓库元数据和数据集市元数据之间必须要有连接。数据集市的元数据包含以下部分:数据源标识,描述当数据由数据仓库传递

到据市所生数定有数集简描信,括格属、系数集时发的据制,关据市的单述息包表、性关

本文介绍了数据仓库系统的设计与实现方法。

武汉科技大学硕学论士位文

第7页

和定义等.同时,元数据允许不同据集市的数达到不同程度的内聚性.在数据集市中 是沿着星型连接的线条和规格化的表格来构造数据的。如果有一个可以预测的使用模式并有大量数据,就可以建立星型连接。如果不预测的使用模式,则使用关系表格作为基础。

由 据以于有少量数及用户等级,所以在数据集市中有着比数据仓库很高的性能期望。使用MDM技术和利用星型连接,以广泛的 DBs及建立索引都是提高性能方法。像数据仓库一样, 数据集市也是面向主题的、集成的、稳定的和不同时间的。数据集市在有些方面与数据仓库有差别,仓库专注于满足数据整个公司的需求,而数据集市专注于特定的主题域、特定的部门或特定的业务功能需要。钢铁销售公司数据仓库包含合同、销售、来款三个主题域,那么也必须有合同、销售、来款三个数据集市。数据集市与数据仓库数据模型设计差不多,主要是在中间层上即逻辑数据模型上有所差别。即星形模式是关系环境中建立高性能数据集市数据结构的最普遍的方法。一个星行模式有两类基本表组成:一个事实表( tT l和多个 F c b) a ae维表 (祝ni T l。事实表包含实际事务或要 i D s o ae n b )分析的值,维表包含有关这些事务、值的描述。数据库中的数据可以分为两个主要类别:描述性值和定量值。

233粒度 ..和分割粒 度是数据仓库的重要概念.粒度分为两种形式,第一种粒度是以数据仓库中的数据的综合程度高低的一个度量,它既影响数据仓库中据量的的数大小,也影响数据仓库所能回答询问的种类.粒度越小,细节程度越高,综合程度越低,回答底部的种类就越多,必然造成数据仓库中的数据大量堆积,十分低下;效率反之,粒度的提高将会提高查询效率。另一种特殊形式的粒度是样本数据库,它是以一

定的采样率从细节档案数据或轻度综合数据中抽取的一个子集。同通常意义的粒度不同,样本数据库的粒度级别不是根据综合程度的不同来划分的,而是根据采样率的高低来划分的,采样粒度不同的样本数据库可以具有相同的综合级别。

分 割是数据仓库的另一个重要概念,它是指将数据分割到各自的物理单元中去以便能分别处理,以提高数据处理效率。分割的数据标准可选择按日期、地区和业务领域,也可按自定义分割标准,分割之后,小单元内的数据相对独立,处理起来更快,更容易。 23 ..据仓库数据组织 4数数据仓库的 数据组织方式可分为虚拟存储方式、基于关系表的存储方式和多维数据库存储方式三种。 (虚拟存储方式 ) 1虚拟存储方式是虚拟数 据仓库的数据组织形式。它没有专门的数据仓库数据存储,数据仓库中的数据仍然在源数据库中,只是根据用户的多维需求及形成的多维视图,临时在源数据库中找出所需要的数据,完成多维分析。这种组织方式较简单、少、花费使用灵活,但对源数据要求较高,即只有当源数据库的数据组织比较规范、没有数据不完备及冗余,

本文介绍了数据仓库系统的设计与实现方法。

第8页

武汉科技大学硕学论士位文

同时又比较接近多维数据模型时,虚拟数据仓库的多维语义层才容易定义。 2 ( )基于关系表的存储方式基于 关系表的存储方式是将数据仓库的数据存储在关系型数据库的表结构中,在元数据的管理下完成数据仓库的功能。这种组织方式在建库时有两个主要过程用以完成数据的抽取。

首先,要 提供一种图形化的点击操作界面,使分析员能对源数据的内容进行选择,定义多维数据模型。然后再编制程序把数据库中的数据抽取到数据仓库的数据库中.这种方式的主要问题是在多维数据模型定义好后,从数据库中抽取数据往往需要编制独立、复杂的程序,因此通用性差、很难维护。3 (多维 数据库的组织 )

多 维数据库的组织是直接面向OA分 LP析操作的数据组织方式。这种数据库产品也比较多,其实现方法不尽相同。其数据组织采用多维数组结构文件进行数据存储,并有维索引及相应的元数据管理文件与数据相对应.

24数据仓库体系结构 .数据 仓库系统(: aa梅r助uesse由。。 s w t e s yt ) m源数据、仓库管理、数据仓库及前端分析工具组成,其体系结

构如图2所示。 . 2

源数据

仓库管理

数据仓库

分析工具

图22数据仓库体系结构图 .

(数据源,数据仓库系统的基础,整个系统的数 是 ) 1是据源泉口通常包括企业内部信息和外部信息。内部信息包括存放于 R中的 D明5各种业务处理数据和各类文档数据。信外部息包括各类法律法规、市场信息和竞争对手的信息等等。 2 (仓库管理, 在确定数据 )仓库信息需求后,先进行数据建首模,然后确定从源数据到数据仓库的数据抽取、清洗和转换过程,最后划分维数及确定数据仓库的物理存储结构。仓库管理包括对数据的安全、归档、备份、维护、恢复等工作。 (数据分 ) 3析工具,用于完成实际决策问需要的题所各种报表工具、查询工具、据分数析工具、数据挖掘工具等,以实现决策支持系统的各种要求。 25数据仓库系统结构 .数 据仓库系统结构是在建立数据仓库平台时所贯彻的一个整体蓝图,是整个底层的甚

本文介绍了数据仓库系统的设计与实现方法。

武汉科技大学硕学论士位文

第9页

础,用来指导在建立和管理数据仓库平台时必须制定的大多数决策。通常可分为两个主要类型:三层结构和两层结构。 251三层结构 ..在 设计中,三层结构的第一层由已存在的事务处理系统构成,用来收集发生在原由M S I系统中所有事件的数据,提供给数据仓库应用。这种结构的第二层和第三层分别是数据仓库和数据集市,如图23 .所示。

查询分析终端

第一层

图Z三层数 J据仓库结构

建立大型的数据仓库环境通常有两种不同的功能需 要:数据合并 (汇集数据)和数据分析 (获取信息)。数据仓库层负责数据合并活动,从操作系统中获取数据。数据合并是指从异类的、不统一的操作系统中抽取、清理和转换数据,成为一个统一的仓库.同时,

将合并数据的各部分供给各个数据集市,完成数据分析活动。数据分析是指允许最终用户访问、处理和一般分析数据以寻找有用信息。于这两种不同需要,因此由分布在两个不同层上使这种结构更加可扩展。数据仓库层由多种操作系统供给数据,需执行所需的抽取和转换,而数据集市层从数据仓库中提取数据.数据仓库 层以非概括化的、详细的形式保存数据,可以设计成一种类似于传统第三范式

模式( aii a hr一o lf sh帕)数据库模式,来充分 t dto lti nr r n d m o ce的 a翔应用该范式中最小化数据冗余的优越性叫。数据仓库必须担当一种存储仓库,用来存储来自不同机构和不同主题领域的大量数据。数据集市中的数据是概括、子集和样本。数据集市可以使用维数模型和星型模式设计。

三 层数据仓库结构的主要优点是高性能和高度扩展性。高性能允许分割不同查询的作业量给不同的数据集市,这意味着某个数据集市的用户不会受其它数据集市作业量的影响;高扩展性是指第二层和第三层可以单独扩增〔。] 5 1但是,该 结构的代价是成本很高。因为设计数据仓库是个复杂的过程,须花费时间来合并多种主题,而建立数据仓库又需要相当的时间和资源,同时成本也很高。

本文介绍了数据仓库系统的设计与实现方法。

兰皿些252两层结构 ..

_

_

武科大士位文汉技学硕学论

有两种方法可 用来建立两层结构。第一种方法是只建立企业级数据仓库,而不是建立

数集市,种方据这法没有从根本上摆脱建立仓库所需数据要承担的杂性和复难度。一另种方法比较常见,就是只建立数据集市,数据集市不依赖于数据仓库而独立存在。这种结构代价是很小的,因为数据集市只有一个或两个主题域的数据,设计和实现上有更小的复杂性,可以处理少量数据源和较少数据,同时硬件上需求也降低了.其结构示意图如图 24 .所示。

查询分析终端

第一层

第二层

图 2两层数据仓库结构 . 4

但是这种结构存在着严重的问题。首先是可扩展性差,已存在的数据集市不能满足其

它外的部门求,另外,需对每个部门需求建立数据集市也是件可怕的事情。253可扩展结构 ..

以 种系统结构似乎都不是最佳的。上介绍的两可扩展结构利用两层结构简单和廉价的优点,从逻辑上设计一个三层结构,但最初使用两层结构来实现,如图25 .所示。当数据集市增长到包含更多主题领域时,最终转换成三层结构。

业务处理终端

查询分析终端

图25可扩展的 .数据仓库结构

本文介绍了数据仓库系统的设计与实现方法。

武汉科技大学硕学论士位文

第n页

在最初的两层结构中的第二层上 ( 即可扩展的数据集市层)必须有两种类型的数据库,第一种类型数据库是“小型数据仓库”,而第二种类型的数据库是从属的数据集市。小型数据仓库应该看作是一个还没有组装完成的企业数据仓库,开始于一个单一主题领域和以一种规范化的模式来存储详

细 (非概括化的)数据,因此这个小型数据仓库应该有一个逻辑数据模型。从属的数据集市从小型数据仓库中抽取数据、概括和聚集数据,然后存储到数据集市表格中。实际上这两个逻辑上数据库通常作为一个物理数据库来执行。随着主题领域数量的增长,数据仓库组件也随之增长,并且有更多的数据集市从中抽 取数据.此时,数据仓库可以独立出来,形成了三层结构。由于数据集市的数据全部从数

据仓库中取,不需要加读所以增其它的抽取处理洲。值得注意的是,型小数据仓库立时建应该确定从操作系统中抽取数据的贯穿主题领域公用线索,确保基于这些线索来实现集成,例如,在商业上一个公用线索是商品销售。 26数据仓库系统设计方法 .

一般而言, 在操作型环境中,系统设计人员能够清晰地了解应用的需求和数据流程,系统设计一般采用系统生命周期法 SL( se eeomn ieC。e,而在分析型 DCS tmDvlpetLf yl) y环境中,设计人员要在与用户不断交流的基础上,逐步明确与完善系统需求,因此数据仓库采用的是与SL不同的CD( ce i Dvl n sse方法, DC LSC l Lf eeo t ytm y e卿e )也可以称为数据仓库生命周期 (wC。 DL两种方法之比 )较见图267 .] l f:数据仓库是一个面向分析型处理的数据环境, 从数据组织到面向主题的数据处理与传统数据库有较大的区别,这决定了进行数据仓库系统设计时,不能照搬传统数据库系统的开发方法。

s£祛 D方 I。5法山方图26SL方法和C璐方法 . D C L

由图26 .可见,数据库系统设计的SL方法有独立的收集需求和分析需求的 D c阶段,而

本文介绍了数据仓库系统的设计与实现方法。

第1 2页个设计过程中。

武科学硕学论汉技大士位文

数据仓库设计采用的 cD方法则没有这样独立的阶 L S段,而是将需求分析的构成贯穿于整 27数据仓库设计步骤 .数据仓库设计是在现存数据库系统基础上开发,着眼于有效的抽取、综合、集成和挖 掘已有数据库的数据资源,服务于企业高层领导管理决策分析的需要,是一种解决问题的过程叫。大体分为以下几步: (制定计 划及建立 ) 1技术环境建立开发数据仓库的目 标和计划,包括数据范围、责任、方法和工程调度等。选择实现数据仓库的软硬件资源,

包括开发平台、 BS DM、网络通信和开发工具等。 2确定分 () 析主题并建立模型根据决策需求建立主要的分析主题, 在反馈和循环中逐渐建立其它分析主题.选择数据源,对数据仓库组织进行逻辑结构设计。主题是数据归类的标准,每个主题对应一个客观分析领域。

(设 ) 3计数据仓库中的对象依据用户需求, 着重于分析主题,开发数据仓库中的数据物理存储结构,设计数据仓库中数据对象事实表和维表。 ()计数据转换程序 4设实现从数据 源中抽取数据、清理数据、一致化数据、综合数据和装载数据等过程的设计。

(管 ) 5理元数据定义数据的意义及系统各组成部分的关系。 元数据包括关键字、属性、数据描述、物

理据构源据构、射转规、合法、码、值、全求变数结、数结映及换则综算代缺省安要、化及时限等。

6选择或设计数据分析工 () 具用于决策支 持系统的分析工具主要包括优化查询工具,统计分析工具, L工具及各 OA P种数据开采工具。 28数据仓 .库关键技术28IEL .. T

E (t c T n o一 a缩 t r s r L d的写,数抽转装 TEr一afmo L xa即据取、换、载的程作 B o过 )为 lw/ B n“ tl n ( i“I l g e的心灵能按统的则成提数的值 s ue n ic e e )核和魂,够照一规集并高据价,是负责完成数据从数据源向目据仓库转化的过程,标数是实施数据仓库的重要步骤。如果说数据仓库的模型设计是一座大厦的设计蓝图,数据是砖瓦的话,那么 EL T就是建设大厦的关键过程。在整个项目中最难部分是用户需求分析和模型设计, E规则设计和实施而 T L

则工量大约占个是作最的,整项目既 8叫这国外众多践中到的遍的6一 0,是内从实得普共%识。

本文介绍了数据仓库系统的设计与实现方法。

本文介绍了数据仓库系统的设计与实现方法。

本文介绍了数据仓库系统的设计与实现方法。

武汉科技大硕学论学士位文

第巧页

就是类别,例如,时间维度的类别可以细化到年、月、日,甚至小时.平面表格中的一个元素(应超立方体中对的一个单元格)可以表示:某年某月某商店的某类产品的销售量.具体如图 21所示: . 0

所有时间年

所有地点

所有产品

所有顾客

拳}别

l月日小时

省市

}品类}顾类 l产种]客别l} l}} l l一一}

指标对象:销售量

图21信息包图

. 0创建信息包图时需要注意的是:确定最高层和最低层的信息需求,以便最终设计出包

含各个层次需要的数据仓库。对于复杂的商业要求进行需求分析时,有时一张信息包图不能反映所有情况,可能需要设计不同的信息包图来满足全部需求,此时应该保证多个信息包图中出现的维度信息和类别信息完全一致。 2822逻辑模型设计 .,.—星型图由 于星型图能清晰地反映概念模型中各种实体间的逻辑关系,并可在此基础上更好的组织检索和查询,使设计者完整地掌握系统的数据流程。因此,可以利用星型图建模技术设计完善的数据仓库逻辑模型。

星型图因其外观似五角星而得名, 它支持以商务决策者的角度定义数据实体,满足面向主题数据仓库设计的需要,并且设计方法简单,易于被系统用户理解.星型图设计的最大优点是它所建立的数据结构具有以下特点,山网囚:在用户查询和收集过程中可对星型图中心的大量指标实体进行筛选、组合、削减和分割,减少并其最终容量。同信息包图的 三个对象对应,星型图拥有三个逻辑实体:指标实体、维度实体和详细类别实体。

指标实体:位于星型图中间的实 体,对应信息包图中的指标对象,是用户最关心的基本实体,为用户的商务活动提供定量数据。它一般代表一个现实事务中的综合水平,仅仅与每个相关维度的一个点对应。在星型图中,用矩形表示指标实体。维度实体 :位于星型图星角上的实体,对应信息包图中的维度对象,其作用是限制用

户的查询结果,据过滤使其从指标实将数体返回较少的行,将主要指标数据进行聚合,同时从而缩小访问范围。在星型图中,用菱形表示维度实体。详细类别实体:对应信息包图中的 详细类别对象。一个维度内的每个单元就是一个类别,代表该维度内的一个单独层次。在星型图中,用结束符号表示详细类别实体。在星型图中, 用户通过维度实体获得指标实体数据,其中指标实体与维度实体间的联系通过每个维度中最低一层的详细类别实体连接。生成星型图需要注意以下两点: (信息包图 中每个独立的 ) 1单元都必须被评估和研究,从而确定它是否合适做详细类

本文介绍了数据仓库系统的设计与实现方法。

第1页 6

武汉科技大学硕学论士位文

别实体,如果用户需要有关类别的附加信息,可以将维度实体分解成与指标实体直接关联的

主维度实体和与主维度实体关联的次维度实体,次维度实体与指标实体间接关联,从而形成星型模式的扩展形式—雪花模式图。 (当多个信息包图 ) 2转换成星型图可能出时,现维度实体的交叉重叠,保证实体的为了一致性需要进行统一处理,确定它们是同一实体在不同层次上的数据反映,还是两个不同的实体。当多个维度实体相关并且存在共性时可能需,要将其合并为一个指标实体。比 如,在销售为主题的数据仓库中,通常具有如下星型图逻辑模型:指标实体: s e, 销售( l )含销售量 (uniy as Qatt);维度实体: 产品维(rdc)客户维(utmr、 Pout、 Csoe)时间维 (i )地区维(ei ) Tm、 e Rgo、 n其它维 (te), ohr在此简写为:、、、R; P C T、0详细类别实体:一e、一e、一e、Rky于ky Pk cky Tky一、 e: y e其星型图,如图 2 n所示。 .

图21面向 .销售主题的星型图

2823物理模型设计 ...根据逻辑模型设计阶段的星型图或 雪花图能够方便地定义物理数据结构。一般将指标实体转化为物理数据库表,称为事实表。事实表首先包括星型图中心的指标量,其次应包括星型图角上的维度实体中层次最低单位的主码。维度实体通常也转化为维数据库表,称为维表,它包括其每一层次的主码和对应的值。维表的关键字是该维度实体对应的详细类别实体的主码。维表和事实表通过维表关键字相关联.除了建立以 上的物理数据结构外,物理模型设计阶段还应该确定如下内 容: (定义数据标准:在定义物理实 ) 1体、关系和字段之前,首先应该明确命名约定,包括数据类型、约束条件、设备、索引、缺省等。 2 ( )定义实体:星型图可以很方便地确定面向主题的数据仓库共享实体,完整定义其属性,包括主键、可选键、外部键、非键标数据、空值等。 3 ( )确定实体特征:完全识别实体特征很重要。这包括键标属性、值的有效范围、完整性约束条件、类型和长度等. (确定数 据容量和更 ) 4新频率:要对每一个数据仓库实体进行容量和更新频率的评估,

本文介绍了数据仓库系统的设计与实现方法。

武汉科技大学硕学论士位文容量包括实体预期的行和模式增加的数量。(确定索引策略,提高数据仓库性能。 ) 5

第1页 7

2

.据存储和管理 . 3数 8数据仓库的 关键是数据的存储和管理。数据仓库的组织管理方式决定了它有别于传统数据库,同时也决定了其对外部数据的表现形式。要决定采用什么产品和技术来建立数据仓库的核心,则需要从数据仓库的技术特点着手分析. (大量 ) 1数据的存储和管理。所涉及的数据量比传统事务处理大得多,且随时间的推移而积累。从现有的技术和产品来看,只有关系数据库系统担当此任。 2并 ()行处理。 在传统联机事务处理应用中,用户访问系统的特点是短小而密集:对于一个多处理系统来说,能够将用户的请求进行均衡分担是关键,这便是并发操作。在数据仓库中,用户访问系统的特点是庞大而稀疏,每一个查询和统计都很复杂,访问的频率并不高。此时系统需要有能力将所有的处理机调动起来为这一个复杂的查询请求服务,将该请求并行处理。由此,并行处理技术在数据仓库中越发重要。 (针对决策支持查询的 ) 3优化。题主要针对关系数据库而言,其它数据管理环此问因境连基本的通用查询能力都还不完善。在技术上,针对决策支持的优化涉及数据库系统的索引机制、查询优化器、连接策略、数据排序和采样等诸多部分。

4支持多维分析的查询 () 模式。这也是关系数据库在数据仓库领域遇到的严峻挑战之一与传统的关系数据库使用上不同,对于数据仓库的访问往往不是简单的表和记录的查询,而是基于用户业务的分析模式,即联机分析。其特点是将数据想象成多维的立方体,用户的查询便相当于在其中的部分维上加以条件,对立方体进行切片、分割,得到的结果是数值的矩阵或向量,并将其制成图表或输入数理统计的算法。284数据表现 ..

数据表现实际上相当 于数据仓库门面,其性能主要集中在多维分析、数理统计和数据挖掘方面。而多维分析又有数据仓库的重要表现形式,由于互联网的发展,使得多维分析领域的工具和产品更加注重提供基于W前 b e端联机分析界面,而不仅仅是在网络上发布数据。数理统计原本与数据仓库没有直接的联系,但在实际应用中,客户需要通过数据的统计来验证他们对某些事务的假设,以进行决策。数据挖掘强调的不仅仅是验证人们对数据特性的假设,而且它更是主动寻找并发现蕴涵在数据之中的规律。29数据仓库的数据分析 .

数据仓库是 进行分析决策的基础,还

必须具有强有力的工具进行分析和决策。 LP O便 A是这样的一个工具,支持复用于杂的分析操作。 L侧重对决策人员 OP A和高层管理人员的决策支持,可以应分析人员要求快速、灵活地进行大数据量的复杂查询处理,并以种直观一易懂的形式将查询结果提供给决策人员,以便决策人员准确掌握企业的经营状况,了解市场需求,制定正确方案,增加企业效益。

本文介绍了数据仓库系统的设计与实现方法。

第1页 8

武汉科技大学硕学文士位论

联 机分析处理( A也称多维分析, OP L)它是一种数据分析技术,能够完成基于某种数据存储的数据分析功能[, A系统所要完成的主要任务包括:] 5 L 2 OP给出数据的多维逻辑视图,视图独立于数据存储的具体形式:允许用户对数据进行交互式查询和数据分析(交互式操作有多种方法,包括钻取、切片和切块等);检索并显示多维表格、图表和图形中的数据,便于坐标轴位置的变换;具有较快的查询响应速度,并要求具有高性能的服务器软硬件。

L O是分析人员、 P A管理人员或执行人员能够从多角度对信息进行快速、一致和交互存取,而获得对数据的从深入了解的一类软件技术。 LP标是满足 O的目 A在多维环境下特定的

查和表印求,而为策活提支 o的心“口 e f概。询报打需从决动供持。 L核是维”诵 n n念 P A s) o“是维”人们观察客观世界的角度,可把一个实体的多项重要属性定义为多个维,使用户能对不同的维上的数据进行比较分析。 A是多维数 L O P据分析工具的集合。例如:在销售数据仓库系统中分析销售情况时,通常可从时间、产品、地区的不同角度深入观察分析产品销售情况.

2910A三层客户/ .. LP服务器结构 L O是 P A建立在客户服务器结构之上的。由/于它要对来自基层的操作数据(企业已如果建立数据仓库,那么操作历史数据可由数据仓库提供)进行多维化表示或预处理,因此它

不同于传统OT软件的两层客户/ L P服务器结构,而是三层客户/服务器机构[. 1 7 l

图2 0三客/务体构阴 . L层户服器系结 2 P 1 A 三层客服务器结构如图 21所示,由户/ . 2数据源(仓库或 OT数据库) L服数据 L P、O P A务器及OA客户机及客户端 L P应用软件组成。。这种结构的优点在于将应用逻辑(逻辑

)业务、 U及 B GI DM严格区分开来,复杂的应用逻辑不是分 S布在网络的众多 P机上, c而是集中存放在应用服务器上,由服务器提供高效的数据存取,安排后台处理以及报表的预处理。 O P是以 数据仓库或数据库为基 A L础,其最终数据来源是底层的 0 P联机事务处 T L (理)数据库系统,数据仓库是OA的主要数据 LP源。这是因为 OA系统要求对用户的任 LP何分析要求都要在一个稳定一致的时间范围内给予响应。为了获得理想的响应速度,进行分析操作前,将所需的数据从分散的企业内部各处的 OT要先 LP数据库中收集出来并进行抽取、净化、转换、汇总等预处理才能使用。同时 O P是面向 A L分析和管理人员的,而管理决策人员大多关心的是综合数据,以便从更高层次、全局的角度来分析理解数据。因此存储了与分析相关的大量综合性数据和细节数据的数据仓库成为 OA的主要 L P数据源。底层 OT L P数据库在需要时(如企业数据仓库还未建立好时)也可为OA的 L分析操作提供数据。 P

本文来源:https://www.bwwdw.com/article/th6e.html

Top