数据备份策略分析研究

更新时间:2023-06-05 21:23:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

数据备份策略分析研究

数据备份策略分析研究

李尚忠  北京大学信息科学技术学院  100871

一、引言及综述

绿色存储是目前全球存储业界的热点。备份快、恢复稳、空间省的备份策略有助于以最为经济高效的方式保护用户数据,落实绿色存储。

在备份策略方面,有完全备份、增量备份、差分备份和渐进式备份等多种技术和概念。这几个技术的概念本身比较容易混淆。本文将从技术本身的特点分析这几个概念,以及研究如何正确应用这些技术。

二、数据备份的概念

数据备份是指为了防止由于操作失误,系统故障等意外原因而导致的数据丢失,而将整个系统的数据或者一部分关键数据通过一定的方法从主计算机系统的存储设备中复制到其他存储设备的过程。其目的是确保丢失的数据能够被很快有效地恢复。数据备份就是要解决数据的高可用性问题。

三、数据备份策略

数据备份策略是针对备份过程的触发和备份数据的具体内容而言。通常可以分为完全备份、增量备份、差分备份和渐进式备份等多种备份方式。以下将逐一做详细介绍和分析:

3.1完全备份(full backup)

完全备份(FullBackup) 是指将系统中所有选择的数据对象进行一次全面的备份,而不论数据对象自上次备份之后是否修改过。这是最基本也是最简单的备份方式。它是所有更进一步、更灵活的备份方式的基础。

对文件系统而言,完全备份是对用户指定的所有文件进行一次全面的备份。它备份全部选中的文件及文件夹,并不依赖文件的存档属性来确定备份哪些文件。也就是说,备份系统不会检查自上次备份

后,文件有没有被更动过;它只是机械性地将每个文件读出、写入,不管文件有没有被修改过。对于选中的文件和文件夹,备份后会标记为已备份,清除存档属性。它也适用于整个磁盘卷的备份。如备份一个系统的C:驱动器,或D:驱动器,等等。

对数据库系统而言,完全备份是对一个或多个数据文件中使用过的数据块的备份。没有使用过的数据块是不被备份的。它不同于对所有必要的数据库元素(配置文件、数据文件、控制文件、重做日志和归档日志)的文件级拷贝。

对于邮件服务器而言,完全备份是对选择好的数据库和相关日志备份,完成以后,它会删除日志,释放磁盘空间。

完全备份的优点是容易被人理解。对应的恢复也是非常简单的操作过程。如果在备份间隔期间出现数据丢失等问题,可以只使用一份备份快速地恢复所丢失的数据。

完全备份的缺点是备份的数据量最大,备份时间最长,所需要的存储容量是最大,对服务器的正常运营也是影响最大。

如果每天都对系统进行完全备份,那么会有大量数据是重复备份,例如操作系统与应用程序。这些重复的数据占用了大量的存储空间,增加用户成本。例如:某系统总数据量是10G,每天变动的文件只有100MB,整个系统中99%的数据没有变化。如果对该系统每天都采用完全备份会导致极大的空间浪费,更谈不上绿色存储。

另外,当数据量特别大、备份时间很长时,为了不影响末端用户作业的运行,常常要选择适合的时间(如周末)来完成备份,而不能过于频繁。由于只能每隔一段较长时间才进行一次完全备份。如果发生数据丢失,只能使用上一次的备份数据恢复到前次备份时数据状况,这期间内更新的数据就有可能丢失,从而降低RPO(Recovery Point Objective)指标。

3.2增量备份(incremental backup)增量备份是指只对上次备份(无论是哪种备份)后系统中变化过的数据对象的

备份。也称为非累积增量备份。这种方式是针对特定的时间段内新创建、更新及删除的数据对象。

对文件系统而言,增量备份会检查自上次备份后,文件有没有被更动过,根据文件的存档属性来确定备份哪些文件。更改包含以下任何项:文件路径;文件大小;上次修改、访问、备份的日期或时间;只读、隐藏、压缩和加密等文件属性。对NTFS文件还有安全性描述符,即所有者安全性标识SID、组 SID、自选访问控制表(ACL)和系统 ACL。对UNIX文件还有UNIX owner和UNIXgroup等。增量备份完成以后,会对于选中的文件和文件夹标为已备份,清除存档属性。

对数据库系统而言,增量备份是指备份一个或多个数据文件的自从上一次同一级别的或更低级别的备份以来被修改过的数据块。例如:Oracele数据库有多个级别的增量备份,以利于更好地进行数据备份。其中,0级备份是所有增量的基础备份。

对于邮件服务器而言,增量备份是将数据库相关联的日志备份存储下来,然后删除磁盘上的源日志。这种备份方式对邮件服务器的影响是最低的。

增量备份的优点是备份时间比完全备份短许多。它没有重复的备份数据,减少了网络带宽占用,节省了存储空间,缩短了备份的时间。因而这种备份方法比较经济,可以频繁地进行。

增量备份的缺点是数据恢复时间长,恢复工作比较麻烦。传统的备份策略是在偶尔进行完全备份后,频繁地进行增量备份。因此恢复操作要做很多工作。如果要恢复一个文件,必须把所有增量备份的磁带都找过一遍,直到找到为止。如果要恢复整个系统,那就得先恢复最近一次的完全备份,要顺序地进行从上次完全备份以来的每一次增量备份的恢复。

3.3差分备份(differential backup)差分备份是指对上次完全备份以来系统中所有变化过的数据对象的备份。也称为累积(cumulative)增量备份。这种备份

数据备份策略分析研究

型绝缘电缆相比,其一致阻抗较低,而且在传输反射的过程中,回波损耗较大。这些特性在电缆受到弯曲或者挤压会变得更坏,若试图提高电缆的某一方面性能将给别的性能带来不利的影响。

在长距离传输中,为DVI和HDMI电缆可能存在的问题寻找解决办法,原则就是尽量保证优化最重要的性能特征,应尽力忽略可能会影响到其它次要的性能特征。

在一套AV设备中,电缆是最薄弱的,容易受到攻击的环节。当连接电缆为模拟音频、视频或者数字音频电缆时,遇到的问题都很容易解决,然而当连接电缆是DVI/HDMI接口电缆时,问题就变得棘手。

可以用两个适配器来解决这个问题,比如将几根电缆通过适配器相连组成一条长电缆又或者通过切割与焊接的方式让他们同时通过同一管道。

这些做法能够很容易改善数字视频电缆性能特性,但是却会产生一系列的图像质量问题。这些电缆的带宽相对较高,在实际运用中,DVI/HDMI接口电缆容易受到集肤效应(skin effect),延迟、阻抗变化和其它一些因素的影响,这些因素在其它类型的电缆中却是那么得无足轻重。

然而对一种电缆而言,对于用户可能用多种不同的元器件与电缆配合使用,此时应该来看DVI电缆的完整规格说明,但也有如下的困难:

1) 厂商会因为其产品的优秀设计与性能表现的保密而不愿公开其技术资料。

2) 要决定何种因素会影响到电缆的性能也实在是太难了。

3) 还有许多因素值得考虑,某些因素或多或少跟芯片制造水平,信号源与接收器的性能有一些关系。

在一个典型的HDTV应用中,一根单single link电缆可能在99%的时间里都是够用的,大部分电脑图形卡输出也仍然是single link,仅在它们的模拟输出有duallink,可获得更高的性能表现。某些新出品的高性能显示器与视频卡都配有dualTMDS link,它们需要是dual link DVI电缆。HDMI标准是向下兼容的,因此,如果在显示器上只有DVI接口,你可以使用一根“HDMI to DVI”转换电缆与其相连。然而,DVI并不像HDMI那样可以传输数字音频信号,因此,若想获得音频输出则需要一个单独的音频连接器。如果正在使用数字音频,那么需要为音频部分使用同轴电缆或者光缆连接器。

最近一次的全量备份数据以及最近一次的累积增量备份数据。

与完全备份相比,差分备份的工作量小,备份时间短,并节省磁盘空间。

与增量备份相比,差分备份的工作量大,随着时间推移而不断增加(假设每天修改的数据都不一样)。但是它的灾难恢复相对简单。因为要查找和恢复的备份记录数目比较少,所以恢复一个文件或整个系统的速度都比较快。

3.4渐进式备份(prograssivebackup)

渐进式备份也称为“只有增量备份”或“连续增量备份”。它是指系统排除完全备份,数据对象只有当发生改变时才被写入到存储介质上。一些专业备份软件借用数据管理特性实现了这种备份方式。它一般应用文件系统的备份。

“完全备份”、“完全+增量备份”或“完全+差异备份”这三种备份组合的一个主要的缺点是完全备份总会被多次执行。如果完全备份每周被执行,无论数据是否真的发生变化,所有数据每周都将被备份。

渐进式备份只在初始时做所有数据文件的全部备份,以后只备份新建或改动过的文件,比上述三种备份方式有更少的数据移动。这种方式减少了备份时间和所需的存储容量,减轻了网络负担。同时数据恢复通过数据库参与来进行,具有更好的恢复性能。此外,这种备份方式可以降低潜在的人为错误,并帮助提高存储管理效率。

四、总结与展望

数据备份的技术涉及面很广,本文结合文件系统、数据库和邮件服务器研究了几种有代表性的数据备份方式,对其原理和优缺点做了细致的分析。让用户在选择备份策略之前,对可能用到的备份方式有一个清晰的了解和掌握。用户从而可以结合自身计算机系统数据量变化的特点,合理运用备份方式来均衡备份性能、恢复性能以及空间利用率。

本文来源:https://www.bwwdw.com/article/8h41.html

Top