浅谈数据库技术与数据仓库

更新时间:2023-05-26 15:34:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

数据仓库是数据库技术的一个新的发展方向,它是一种交叉学科的开放式体系结构,是一种由多种技术构成的灵活的数据分析型环境。如何正确理解数据库技术与数据仓库对系统开发领域起到了至关重要的作用。

科技信息

计算机与网络

浅谈数据库技市与数据仓库湖南水利水电职业技术学院学院吴振国[摘要]数据仓库是数据库技术的一个新的发展方向,它是一种交叉学科的开放式体系结构,一种由多种技术构成的灵活的数据是分析型环境。如何正确理解数据库技术与数据仓库对系统开发领域起到了至关重要的作用。 [关键词]数据库技术数据仓库一

数据技术发展概述

在数据库出现前,计算机用户是使用数据文件来存放数据的。常用的高级语言从早期的 F R R N到今天的 c语言,都支持使用数据文 O TA件。有一种常见的数据文件的格式是,一个文件包含若干个“记录”一,个记录又包含若干个“数据项”用户通过对文件的访问实现对记录的,存取。通常称支持这种数据管理方式的软件为“文件管理系统”在这种。管理方式下,这些数据与其他文件中数据有大量的重复,造成了资源与人力的浪费。随着计算机所处理的数据的日益增多,数据重复的问题越来越突出。于是人们就想到将数据集中存储、统一管理,这样就演变成数据库管理系统从而形成数据库技术。 数据库的诞生以 2世纪 6年代 I M公司推出的数据库管理产品 O 0 B I ( fr t n ngmet ytm为标志。数据库的出现, MSI omao Maae n s】 n i S e实现了数据资源的整体和结构化管理,使数据具有了共享性和一定的独立性,并能够对冗余度进行控制。数据库管理系统的推出,使得数据库概念得到了 普及,也使得人们认识到数据的价值和统一管理的必要。但是由于 I MS是以层次模型来组织和管理数据的,对非层次数据使用虚拟记录,大量指针的使用降低了数据使用的效率,同时,数据库管理系统提供的数据模型机及数据库语言比较低级,数据的独立性也比较差,给使用带来了很大的局限性。为了克服这些缺点,国数据库系统语言 ̄ (O AS L美 CD Y,即 C ne neO a yt a gae下属的数据库任务组 ( T即 o fe c nD t S s mL nug) f a e DB G, D t ae akGo p对数据库的方法和技术进行了系统研究,提出了 a B sTs ru) a并著名的 D T B G报告。该报告确定并建立了数据库系统的许多基本概念、 方法和技术,报告成为网状数据模型

的典型技术代表,它奠定了数据库发展的基础,并影响着以后的研究。网状模型是基于图来组织数据的, 对数据的访问和操纵需要遍历数据链来完成。因这种有效的实现方式对系统使用者提出了很高的要求,所以阻碍了系统的推广应用。 17 9 0年 I M公司的 E..o d发表了著名的基于关系模型的数据 B FC d库技术的论文《大型共享数据库数据的关系模型》并获得 18年 A M, 91 C 图灵奖,标志着关系模型数据库模型的诞生。由于关系模型的简单易理解及其所具有的坚实理论基础,整个 2世纪 7年代和 8年代的前半 0 0 0期,数据库界集中围绕关系数据库进行了大量的研究和开发工作,对关系数据库概念的实用化投入了大量的精力。2世纪 8年代以来, O 0关系系统逐渐代替网状系统和层次系统而占领了市场。实践证明,由于关系模型具有严格的数学基础,概念清晰简单,数据独立性强,支持商在业数据处理的应用上非常成功。但是,系模型不能用一张表模型表示关出复杂对象的语义,不擅长于数据类型较多、复杂的领域。随着多媒较体应用的扩大,对数据库提出了新的需求,要求数据库系统能存储和处理图形、图像、声音等复杂的对象,并能实现复杂对象的复杂行为。在这种需求的驱动下,数据库模型又进入了新的研究阶段——面向对象数据库技术的研究。 2 0世纪 8 0年代中期以来,面向对象数据库系统”0 DB )“对“ (O S ̄I对象关系数据库系统” R B )究都十分活跃。18年和 19先后 ( D S的研 O 99 90发表了《面向对象数据库系统宣言》第三代数据库系统宣言》和《。面向 对象数据库系统是指支持面向对象特性的数据库,它提供了面向对象的建模方法、编程语言和数据库语言,支持正文、图像、图形、音等新声的数据类型,支持类、继承、函数,方法等丰富的对象机制,能提供高并度集成的、可支持客户机/服役器应用的用户接口。1 8 9 9年在东京举行了关于面向对象数据库的国际会议,第一次定义了面向对象数据库管理系统所应实现的功能:支持复杂对象、支持对象标识、允许对象封装、 支持类型或类、支持继承、免过早绑定、避计算性完整、可扩充、能记住数据位置、能管理非常大型的数据库、接收并发用户、能从软硬件失效中

恢复、用简单的方法支持数据查询。有一些厂商已推出了具有对象关系数据库特征的产品, rce O al就是其中之一,具有查询对象关系能力的新一代数据库语言标准 S L已经历了 S L 9 S 20 S L 0 5等阶 Q Q 9、QL 00、Q 2 0段,它的完善标志着数据库技术的进步和成熟,数据库操纵功能已溶入

事物处理环境上的。随着技术的进步,人们试图让计算机担任更多的工作,而数据库技术也一直力图使自己能胜任从事务处理、批处理到分析处理的各种的信息处理任务。后来人们逐渐认识到,目前的计算机处在理能力上,根本无法实现这种功能,且,另一方面,务处理和分析 而在事处理具有极不相同的性质,直接用事务处理环境来支持决策是行不通的。 事务处理环境不适宜决策应用的原因如下:首先,在事务处理环境中,用户一般是具体的工作人员,他们的行为特点是数据的存取操作,

且不知道信息对决策的用处,操作的频率高而且每次操作处理的时间短;在分析处理环境中,户是企业的高级管理人员,用是信息的探索者, 他们的主要目的是将产生的数据抽象为信息,以便决策。其行为模式与事务处理环境的用户行为完全不同,他们可能会使一个决策支持系统 D SD cs n maigS p ot y—tm) S (eio- i kn u prs s e应用程序连续工作几个小时, 从而消耗大量的系统资源。其次, S D S需要集成的、即时更新的、历史的、综合的数据。全面而正确的数据是有效分析和决策的首要前提,相关数据收集得越完整,到的结果就越可靠。当前,得绝大多数企业数据的真正状况是分散而非集成的,在事务处理环境中,部分历史记录甚至被搁置起来成为浪费的资源。 近年来,随着数据库技术的应用和发展,人们尝试对数据库中的数据进行再加工,成一个综合的、形而向分析的环境,以更好地支持决策分析,从而形成数据仓库技术(a Wa hui, D t r os g简称 D。 a e n 作为 D S S数据仓库系统包括:数据仓库技术;联机分析处理技术fn Ln nl i O— i A a t e y— c rcsig O A )数据挖掘技术(a nn, ) l aPoesn, L P; D t MiigDM三个方面。 a 如果说传统的联机事务处理强调的是更新数据库,即向数据

库中 添加信息,那么数据仓库针对的联机分析处理强调的则是从数据库中获取信息,利用信息。2 0年以前查不到所需要的数据是因为数据太少了,而今天查询不到数据是因为数据太多了。著名的数据仓库专家 R lhKm a写道:我们花了 2 ap ib l l“ 0多年的时间将数据放人数据库,如今是该将它们拿出来的时候了。”数据仓库正因此需要而诞生。三、据仓库与数据库的区别与联系数数据仓库体系主要是由数据库技术实现的,数据库的泛化发展形成了数据仓库,然而数据库与数据仓库在很多方面存在着相当大的差异。

到各高级语言之中,: B、#J V如 V c、A A等。 二、数据仓库的出现各种各样的数据库系统正在不断地发展和完善。当前的商业、企业管理的数据处理大致可以分成两类:操作型处理和分析型处理。操作型

数据仓库的最终目的是辅助决策。在初期建设阶段,用户可以见到仓库的数据高效展现以及进行 S QL数据查询,主要任务是建立企业模型、阶段规划/主题选取、技术准备工作、逻辑设计以及物理设计等。在实践中与数据库系统的设计和实现方法十分类似,例如建立企业模型, 就是从企业用户的角度对企业所需数据的内容以及数据间的关系的抽象,可以用 E既 R模型方法,可以用面向对象的分析方法。也 尽管在局部上数据库与数据仓库的实现方法和技术相近,但是, 由于最终目的不同,使得在概念以及一些方法和技术上不同。比如,在数据仓库初期建设中,继建立企业模型之后的阶段规划/主题选取的任务,在整个数据库系统设计与实现上是没有的。 数据仓库的建设不是一个简单的项目,而是将其目标分阶段逐步实现。首先为阶段任务选择合适的主题,其原则是把管理层最急需和数据易实现的选题放在第一位。数据仓库的设计与传统计算机系统开发方式截然不同,因为建成后,仓库的预测结果仍需时间检验或分析验证,以成功的数据仓库始于对要开发领域业务过程的深刻理解。所数据仓库的设计是业务知识与技术知识的有机合成。 四、束语结 2世纪是信息世纪,在目前竞争激烈的知识经济环境和电子商务 1经济模式下,重要的信息往往可以决定企业的成败,甚至决定企业的生死存亡。数据仓库技术以其强大的信息处理能力,将被广泛地应用到国 民经济

的各行各业中,它可以充当企业决策机构的电子智囊和电子参谋。总之,随着社会的发展,数据仓库的应用范围也必将越来越大,它也必将发展的更加完善。参考文献[] 1王珊,盛恩数据库基础与应用[ .李 M]北京:民邮电出版社。人2 0 0 2.

处理也叫事务处理,一般是针对非常具体的业务,是对数据库联机的日 常操作,通常是对一个或一组记录的查询和修改,主要是为特定的应用服务的。人们关心的是响应时间、数据的安全性和完整性。分析型处理般是针对某个主题,在时间段上有比较长的延伸,它操作的是大量的数据甚至是海量的,这些数据是操作型数据的一种积累和遴选,它主要是面向决策支持的。 数据库系统在相当长的时间内作为数据管理的主要手段,它从诞生起,就主要用于事务处理,经过数十年的发展,这些数据库中已经在保存了大量的日常业务数据。传统的业务系统一般是直接建立在这种一

[] 2罗运模.QL evr0 0数据仓库应用与开发[] S S re2 0 M .北京:民邮人电出版社 .0 1 20.

[] 3施伯 f等 . t数据仓库与数据挖掘研究进展[] . 1_计算机应用与软件 .0 31 . 2 0 .0

[] 4王泽明.浅谈数据仓库技术[ . M]计算机应用与软件, 0 (: 2 11 0 )3 -4 9 2

[] 5徐仲 .仓库技术在图书馆中的应用[]数据 I.图书馆建设,0 1 20( ) 5 -5 1: 1 2.

. — -

2 39.— - -—

本文来源:https://www.bwwdw.com/article/72o4.html

Top