数据库未来发展趋势(更新版)

更新时间:2024-04-30 03:18:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

东华大学

报告名称: 数据库技术最新发展

学 院:专 业:姓 名:学 号:指导老师:

2015-12-10

1.引言

自从计算机问世以后,就有了处理数据、管理数据的需求,由此,计算机技术新的研究分支数据库技术应运而生。数据库(Databases,简称DB)是指长期保存在计算机的存储设备上、并按照某种模型组织起来的、可以被各种用户或应用共享的数据的集合。数据库管理系统(Database Management Systems,简称DBMS)是指提供各种数据管理服务的计算机软件系统,这种服务包括数据对象定义、数据存储与备份、数据访问与更新、数据统计与分析、数据安全保护、数据库运行管理以及数据库建立和维护等。

随着计算机应用领域的不断拓展和多媒体技术的发展,数据库已是计算机科学技术中发展最快、应用最广泛的重要分支之一。从20世纪60年代末开始,数据库系统已从第一代层次数据库、网状数据库,第二代的关系数据库系统,发展到第三代以面向对象模型为主要特征的数据库系统。关系数据库理论和技术在70~80年代得到长足的发展和广泛而有效地应用,80年代,关系数据库成为应用的主流,几乎所有新推出的数据库管理系统(DataBaseManagementSystem,DBMS)产品都是关系型的,他在计算机数据管理的发展史上是一个重要的里程碑,这种数据库具有数据结构化、最低冗余度、较高的程序与数据独立性、易于扩充、易于编制应用程序等优点,目前较大的信息系统都是建立在关系数据库系统理论设计之上的。但是,这些数据库系统包括层次数据库、网状数据库和关系数据库,不论其模型和技术上有何差别,却主要是面向和支持商业和事务处理应用领域的数据管理。然而,随着用户应用需求的提高、硬件技术的发展和InternetIntranet提供的丰富多彩的多媒体交流方式,促进了数据库技术与网络通信技术、人工智能技术、面向对象程序设计技术、并行计算技术等相互渗透,互相结合,成为当前数据库技术发展的主要特征,形成了数据库新技术。目前,数据库技术已相当成熟,被广泛应用于各行各业中,成为现代信息技术的重要组成部分,是现代计算机信息系统和计算机应用系统

的基础和核心。

2.数据库技术的发展历程

在数据库系统出现以前,各个应用拥有自己的专用数据,通常存放在专用文件中,这些数据与其他文件中数据有大量的重复,造成了资源与人力的浪费。随着机器内存储数据的日益增多,数据重复的问题越来越突出。于是人们就想到将数据集中存储、统一管理,这样就演变成数据库管理系统而形成数据库技术。

数据库的诞生以20世纪60年代IBM 推出的数据库管理产品IMS为标志。1969年IBM 公司研制了基于层次模型数据库管理系统IMS(Information Management System),并作为商品化软件投入市场。数据库的出现,实现了数据资源的整体管理。IMS系统的推出,使得数据库概念得到了普及,也使得人们认识到数据的价值和统一管理的必要性。由于IMS是将数据组织成层次的形式来管理,对非层次数据使用虚拟纪录,大量指针的使用降低了数据使用的效率,同时,数据库管理系统提供的数据模型机及数据库语言比较低级,数据的独立性也比较差,给使用带来了很大的局限性。为了克服这些缺点,美国数据库系统语言协会(CODASYL,即Conference On Data System Language)下属的数据库任务组(DBTG,即DataBase Task Group)对数据库的方法和技术进行了系统研究,并提出了著名的DBTG报告。该报告确定并建立了数据库系统的许多基本概念、方法和技术,报告成为网状数据模型的典型技术代表,它奠定了数据库发展的基础,并影响着以后的研究。网状模型是基于图来组织数据的,对数据的访问和操纵需要遍历数据链来完成。因这种有效的实现方式对系统使用者提出了很高的要求,所以阻碍了系统的推广应用。

1970年IBM公司的E.F.Codd表了著名的基于关系模型的数据库技术的论文《大型共享数据库数据的关系模型》,并获得1981年ACM图

灵奖,标志着关系型数据库模型的诞生。由于关系模型的简单易理解及其所具有的坚实理论基础,整个20世纪70年代和80 年代的前半期,数据库界集中围绕关系数据库进行了大量的研究和开发工作,对关系数据库概念的实用化投入了大量的精力。80年代以来,关系系统逐渐代替网状系统和层次系统而占领了市场。但是,关系模型不能用一张表模型表示出复杂对象的语义,不擅长于数据类型较多、较复杂的领域。在这种需求的驱动下,数据库模型又进入了新的研究阶段面向对象数据库的研究。面向对象数据库是指支持面向对象特性的数据库,它提供了面向对象的建模方法、编程语言和数据库语言。

1989年在东京举行了关于面向对象数据库的国际会议,第一次定义了面向对象数据库管理系统所应实现的功能:支持复杂对象、支持对象标识、允许对象封装、支持类型或类、支持继承、避免过早绑定、计算性完整、可扩充、能记住数据位置、能管理非常大型的数据库、接收并发用户、能从软硬件失效中恢复、用简单的方法支持数据查询。作为一项新兴的技术,面向对象数据库的发展远不如关系数据库成熟。因此,面向对象数据库还有待于进一步研究。

3.数据库技术的现状及发展趋势

1980年以前,数据库技术的发展,主要体现在数据库的模型设计上。进入90年代后,计算机领域中其它新兴技术的发展对数据库技术产生了重大影响。数据库技术与网络通信技术、人工智能技术、多媒体技术等相互渗透,相互结合,使数据库技术的新内容层出不穷。数据库的许多概念、应用领域,甚至某些原理都有了重大的发展和变化,形成了数据库领域众多的研究分支和课题,产生了一系列新型数据库。分析目前数据库的应用情况,可以发现:经过多年的积累,企业和部门积累的数据越来越多,许多企业面临着“数据爆炸”可知识缺乏的困境。如何解决海量数据的存储管理、如何挖掘大量数据中包含的信息和知识,已成为目前的急待解决的问题。所以,数据库技术除

了核心问题的研究外,市场的需求导致了以下几种数据库的发展及一些研究热点:

3.1 分布式数据库

80年代,研制了许多分布式数据库的原型系统,攻克了分布式数据库中许多理论和技术难点。90年代开始,主要的数据库厂商对集中式数据库管理系统的核心加以改造,逐步加入分布处理功能,向分布式数据库管理系统发展。目前,分布式数据库开始进入实用阶段。现有的分布式数据库技术尚不能解决异构数据和系统的许多问题。虽然已有很多数据库研究单位在进行异构系统集成问题的探索,并且已有一些系统宣称在一定程度上实现了异构系统的互操作,但是异构分布式数据库技术还未成熟。

3.2 并行数据库

并行数据库系统是在并行机上运行的具有并行处理能力的数据库系统。最近,一些著名的数据库厂商开始在数据库产品中增加并行处理能力,试图在并行计算机系统上运行。他们只是使用并行数据流方法对原有系统加以简单的扩充,既没有使用并行数据操作算法,也没有并行数据查询优化的能力,都不是真正的并行数据库系统。目前,并行数据库的研究工作集中在体系结构、并行算法与查询优化等。

3.3 主动数据库

主动数据库是相对于传统数据库的被动性而言的。许多实际的应用领域,如计算机集成制造系统、管理信息系统、办公室自动化系统中常常希望数据库系统在紧急情况下能根据数据库的当前状态,主动适时地做出反应,执行某些操作,向用户提供有关信息。传统数据库系统是被动的系统,它只能被动地按照用户给出的明确请求执行相应的数据库操作,很难充分适应这些应用的主动要求,因此在传统数据

库基础上,结合人工智能技术和面向对象技术提出了主动数据库。主动数据库的主要目标是提供对紧急情况及时反应的能力,同时提高数据库管理系统的模块化程度。主动数据库通常采用的方法是在传统数据库系统中嵌入!\(即事件—条件—动作)规则,在某一事件发生时引发数据库管理系统去检测数据库当前状态,看是否满足设定的条件,若条件满足,便触发规定动作的执行。

3.4 知识库

知识数据库系统的功能是如何把由大量的事实、规则、概念组成的知识存储起来,进行管理,并向用户提供方便快速的检索、查询手段。因此,知识数据库可定义为:知识、经验、规则和事实的集合。知识数据库系统应具备对知识的表示方法;对知识系统化的组织管理;知识库的操作;库的查询与检索;知识的获取与学习;知识的编辑;库的管理等功能。知识数据库是人工智能技术与数据库技术的结合。

3.5 多媒体数据库

随着多媒体技术的发展,多媒体应用逐步深入,多媒体应用涉及大量的多媒体信息,它们包括图形、文本、图像、声音、视频等信息。多媒体信息系统的建立强烈地呼唤着管理多媒体的数据库技术,在这样的背景下,产生了多媒体数据库技术。多媒体数据库应具备的功能要求为:能表示和理解多媒体数据,能刻画、管理和表现各种媒体数据的特性和相互关系;具备物理数据独立性、逻辑数据独立性和媒体数据独立性,媒体类型可扩展;提供更为灵活的模式定义和修改功能,支持模式进化与演变,具备某些长事务处理的能力;提供多媒体访问的多种手段,近似性查询,混合方式访问等。多媒体数据管理系统在多媒体应用中非常重要,它为多媒体应用提供了基本数据支撑。多媒体数据库的研究始于80年代中期,在多年的技术研究和系统开发中,获得了很大的成果。但目前还没有功能完善、技术成熟的多媒体数据库管理系统。

3.6 XML数据库

经过近几年业界同仁的共同努力,XML数据库技术取得了很大的进展,已经有若干种XML数据库产品问世并服务于社会生活的各个方面。但是,XML数据库的事业才刚刚开始,还有很多问题等待着我们去解决。 未来几年,XML数据库技术有可能在下述方面取得进展:异构数据源的集成;底层索引结构; 并发加锁协议。XML模式规范化是一个值得关注的方向。一旦取得突破,将会使我们可以像在关系库中那样方便地设计XML数据库的结构,消除数据的冗余和不一致现象。目前,这一领域已经成为学术界关注的热点。但是,完整的、为业界所公认的理论体系尚未建立。

3.7 模糊数据库

模糊数据库是在一般数据库系统中引入”模糊”概念,进而对模糊数据、数据间的模糊关系与模糊约束实施模糊数据操作和查询的数据库系统。模糊数据库系统中的研究内容涉及模糊数据库的形式定义、模糊数据库的数据模型、模物数据库语言设计、模糊数据库设计方法及模糊数据库管理系统的实现。近年来,也有许多工作是对关系之外的其它效据模型进行模糊扩展,如模糊E-R(实体—关系)、模糊多媒体数据库等。当前,科研人员在模糊数据库的研究、开发与应用系统的建立方面都做了不少工作,但是,摆在人们面前的问题是如何进一步研究与开发大型适用的模糊数据库商业性系统。

3.8 数据仓库和联机分析处理(OLAP)

为了有效地支持决策分析,近几年人们提出了数据仓库的概念。数据仓库就是从不同的源数据中抽取数据,将其整理转换成新的存储格式,为决策目的将数据聚合在一种特殊的格式中,这种支持管理决策过程的、面向主题的、集成的、稳定的、不同时的数据聚合称为数据仓库(Data Warehouse)。数据仓库中数据的组织方式有虚拟存储、

基于关系表的存储和多维数据库存储3种存储方式。整个仓库系统可分为数据源、数据存储与管理、分析处理3个功能部分。由于数据仓库是集成信息的存储中心,由数据存储管理器收集整理源信息的数据成为仓库系统使用的数据格式和数据模型,并自动监测数据源中数据的变化,反映到存储中心,对数据仓库进行更新维护。而联机分析处理(OLAP)是数据仓库上的最重要应用,是决策分析的关键。数据仓库是为了有效地支持决策分析,而从操作数据库中提取并经过加工后所得到的数据集合,是一个特殊的数据库。数据仓库也需要由一个数据库管理系统支持,它有关系型和多维型两类数据库管理系统。

3.9 数据挖掘

数据挖掘(Data Mining)又称数据开采,就是从大量的、不全的、有噪声的、模糊的、随机的数据中提取隐含在其中的人们事先不知道的、但又是潜在有用的信息和知识的过程,提取的知识表现为概念(Concepts)、规则(Rules)、规律模式约束等形式。在人工智能领域又习惯称其为数据库中知识发现(KDD,即Knowledge Discovery in Database)。其本质类似于人脑对客观世界的反映,从客观的事实中抽象成主观的知识,然后指导客观实践,数据挖掘就是从客体的数据库中概括抽象提取规律性的东西以供决策支持系统的建立和使用。

数据开采以数据库中的数据为数据源,整个过程可分为数据集成、数据选择、预处理、数据开采、结果表达和解析等过程。开采的范围可针对多媒体数据库、数据仓库、Web数据库、主动型数据库、时间型及概率型数据库等。采用的技术有人工神经网络、决策树、遗传算法、规则归纳、分类、聚类、减维、模式识别、不确定性处理等。发现的知识有广义型知识、特征型知识、差异型知识、关联型知识、预测型知识、偏离型知识。目前数据采掘的研究和应用所面临的主要挑战是:对大型数据库的数据采掘方法;对非结构和无结构数据库中的数据采掘操作;用户参与的交互采掘;对采掘得到的知识的证实技

术;知识的解释和表达机制;由于数据库的更新,原有知识的修正;采掘所得知识库的建立、使用和维护。

3.10 面向对象数据库及数据可视化技术

面向对象数据库系统将数据作为能自动重新得到和共享的对象存储,包含在对象中的是完成每一项数据库事务处理指令,这些对象可能包含不同类型的数据,包括传统的数据和处理过程,也包括声音、图形和视频信号,对象可以共享和重用。面向对象的数据库系统的这些特性通过重用和建立新的多媒体应用能力使软件开发变得容易,这些应用可以将不同类型的数据结合起来。面向对象数据库系统的好处是他支持WWW应用能力。然而,面向对象的数据库是一项相对较新的技术,尚缺乏理论支持,他可能在处理大量包含很多事务的数据方面比关系数据库系统慢得多,但人们已经开发了混合关系对象数据库,这种数据库将关系数据库管理系统处理事务的能力与面向对象数据库系统处理复杂关系与新型数据的能力结合起来。

数据可视化是指在计算机屏幕上以图形或图像方式,形象地向用户显示各种数据,使用户快速地理解和吸收数据所表示的信息,以提高人的大脑二次处理信息的速度和能力。可见,数据可视化是提高人类吸收和处理信息的速度和能力的重要途径。数据可视化是一个刚刚开始的新的研究领域,还有许多问题有待探索。目前已经被提出的数据可视化技术有:几何可视化技术、基于图标的可视化技术、基于象素的可视化技术、分析可视化技术等。

4.数据库技术的未来发展

数据、计算机硬件和数据库应用,这三者推动着数据库技术与系统的发展。数据库要管理的数据的复杂度和数据量都在迅速增长;计算机硬件平台的发展仍然实践着摩尔定律;数据库应用迅速向深度、

广度扩展。尤其是互联网的出现,极大地改变了数据库的应用环境,向数据库领域提出了前所未有的技术挑战。这些因素的变化推动着数据库技术的进步,出现了一批新的数据库技术,如Web数据库技术、并行数据库技术、数据仓库与联机分析技术、数据挖掘与商务智能技术、内容管理技术、海量数据管理技术等。限于篇幅,本文不可能逐一去展开来阐述这些方面的变化,只是从这些变化中归纳出数据库技术发展呈现出的突出特点。

“四高”即DBMS具有高可靠性、高性能、高可伸缩性和高安全性。数据库是企业信息系统的核心和基础,其可靠性和性能是企业领导人非常关心的问题。因为,一旦宕机会给企业造成巨大的经济损失,甚至会引起法律的纠纷。最典型的例子就是证券交易系统,如果在一个行情来临的时候,由于交易量的猛增,造成数据库系统的处理能力不足,导致数据库系统崩溃,将会给证券公司和股民造成巨大的损失。在我国计算机应用的早期,由于计算机系统还不是企业运营必要的成分,人们对数据库的重要性认识不足,而且为了经费上的节约常常采用一些低层次的数据管理软件,如dBASE等,或者盗版的软件。但是,随着信息化进程的深化,计算机系统越来越成为企业运营的不可缺少的部分,这时,数据库系统的稳定和高效是必要的条件。在互联网环境下还要考虑支持几千或上万个用户同时存取和7x24小时不间断运行的要求,提供联机数据备份、容错、容灾以及信息安全措施等。

事实上,数据库系统的稳定和高效也是技术上长久不衰的追求。此外,从企业信息系统发展的角度上看,一个系统的可扩展能力也是非常重要的。由于业务的扩大,原来的系统规模和能力已经不再适应新的要求的时候,不是重新更换更高档次的机器,而是在原有的基础上增加新的设备,如处理器、存储器等,从而达到分散负载的目的。数据的安全性是另一个重要的课题,普通的基于授权的机制已经不能满足许多应用的要求,新的基于角色的授权机制以及一些安全功能要素,如存储隐通道分析、标记、加密、推理控制等,在一些应用中成为切切实实的需要。

“互联”指数据库系统要支持互联网环境下的应用,要支持信息系统间“互联互访”,要实现不同数据库间的数据交换和共享,要处理以XML类型的数据为代表的网上数据,甚至要考虑无线通讯发展带来的革命性的变化。与传统的数据库相比,互联网环境下的数据库系统要具备处理更大量的数据以及为更多的用户提供服务的能力,要提供对长事务的有效支持,要提供对XML类型数据的快速存取的有效支持。

“协同”面向行业应用领域要求,在DBMS核心基础上,开发丰富的数据库套件及应用构件,通过与制造业信息化、电子政务等领域应用套件捆绑,形成以DBMS为核心的面向行业的应用软件产品家族。满足应用需求,协同发展数据库套件与应用构件,已成为当今数据库技术与产品发展的新趋势。规划中的Oracle11i的主要扩展方面据称主要也是各种面向应用套件的支持。

此外,数据库的发展还有以下一些新特点: (1)提供持续的数据可用性

构建一个高可用性 IT 基础架构,对所有希望在当今瞬息万变的经济环境中立于不败之地并取得成功的企业而言都至关重要。

作为数据库市场的领跑者,Oracle在其最新的10g数据库版本中增强了RAC技术。微软公司在其最新的数据库SQL Server 2005中利用数据库镜像、故障转移群集和改进联机操作等特性,可将故障时间控制到最低,并有助于确保企业系统随时接受访问调用。

(2)用低成本实现系统的伸缩性

大多数企业的每个主要应用系统都拥有专门的存储器和服务器,这样传统的布署,个别看好像效果不错。但这样做的后果就是必须付出高昂的代价,来满足大量系统的维护,而且因故障节点的增多,系统更容易出现故障。

此外,由于单个系统必须有足够的规模以适应高峰容量,但资源却难以从一个系统转移到另一个系统,结果导致企业存储器和 CPU 资源大量闲置。分析家认为,目前企业内部一般的存储器的利用率仅

为 50%,而 CPU 利用率则是可怜的15-20%。

(3)保证互联网架构下的安全

企业将应用架构在互联网平台上,都面临如何保护互联网架构下的数据安全问题。各大数据库厂商嗅到其中的巨大商机,加强了其数据库产品在数据安全上的支持。

甲骨文公司在其10g版本中提供的存储数据加密、虚拟私有数据库、Label Security等技术;微软的SQL server 2005通过数据库加密、缺省安全设置、口令策略实施、粒度权限控制和强化安全模型等功能特性为企业数据提供最高层次的安全保障,就是其中的佼佼者。

(4)集成商业智能功能

大多数企业中,商业智能应用程序的部署是沿着技术线路划分的。不太复杂的报表和即席查询工具的部署通常使用的是数据仓库和基于 SQL 的报表工具,而较复杂的分析和计划应用程序的部署则是使用其他特殊的数据库和工具。

各大厂商除了纷纷加强了其联机分析产品,报表工具,ETL工具的功能外,更试图将这些东西集成在一个完整的数据库平台中。使数据库产品不再仅仅是提供一般的数据存贮功能,而能提供从数据存贮到数据分析使用的整体解决方案。

(5)简化数据库的管理

今天,业务环境的竞争日趋激烈,如何以最低的成本,同时不以降低服务水平为代价,管理信息技术(IT)基础设施是企业目前面临的挑战。

越来越多的用户希望数据库产品能自我管理,可以自动地对自身进行监控、适应和调整,从而显著减少了IT管理人员的数量,降低了管理成本整合能力。

5. 结束语

数据库管理系统已经成为软件产业的重要组成部分,是信息化过程中最重要的技术基础之一。我国要振兴软件产业,就必须发展自己的数据库软件产业。这已经获得了广泛的共识,目前要解决的关键问题是如何能够“做得出、用得上、卖得掉”。我们认为,数据库软件的发展将仍然是关系系统内核基础上进行扩展的技术路线。

数据库系统的功能从早期的数据存储、查询到联机事务处理,再到数据挖掘,从单纯的数据库发展到与之相关的模型库、知识库的集成,其所取得成就是令人瞩目的。当然,所有这些都还有许多局限性,还有许多关键问题等待解决,而且,随着应用领域日益广泛,硬件技术的不断提高,数据库技术还要面临新的挑战。当前数据库技术的发展呈现出与多种学科知识相结合的趋势,凡是有数据(广义的)产生的领域就可能需要数据库技术的支持,它们相结合后即刻就会出现一种新的数据库成员而壮大数据库家族。新一代的数据库技术应能完成新应用的要求。这些新的课题有待于数据库研究者及所有计算机工作者的努力。目前由于人类知识技术的局限性,数据库技术呈现出了明显的分支性,今后必将走向大一统。

本文来源:https://www.bwwdw.com/article/2rkg.html

Top