RAID数据恢复技术揭秘

更新时间:2023-06-10 18:25:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

RAID数据恢复技术揭秘

RAID数据恢复技术揭秘

如果采用RAID技术,可以让很多硬盘同时传输数据,而这些硬盘在逻辑上又表现为一块硬盘,所以使用RAID可以达到单个硬盘几倍,甚至几十倍的速率。

也就是说,RAID技术可以通过在多个硬盘上同时存储和读取数据的方式来大幅提高存储系统的数据吞吐量。

3.提供更高的安全性

RAID可以通过数据校验提供容错功能,在很多RAID模式中都有较为完备的冗余措施,甚至是直接相互的镜像备份,从而大大提高了RAID系统的容错性,让系统的稳定性更好、安全性更高。

1.1.3 RAID级别简介

RAID技术针对不同的应用需求而使用不同的技术类别,这些类别被称为RAID级别,每一种级别代表一种技术。目前业界公认的标准是RAID-0级、RAID-1级、RAID-2级、RAID-3级、RAID-4级、RAID-5级,这些不同的级别并不代表技术的高低,也就是说,RAID-5并不高于RAID-0,RAID-1也不低于RAID-4,至于该选择哪一种RAID级别的产品,需要根据用户的操作环境和应用需求而定,与级别的高低没有必然的关系。

在上面提到的RAID-0~RAID-5这6个级别之间,还可以互相组合出新的RAID形式,如RAID-0与RAID-1组合成为RAID-10;RAID-0与RAID-5组合成为RAID-50等。

除了RAID-0~RAID-5这6个级别以及它们之间的组合以外,目前很多服务器和存储厂商还发布了很多非标准RAID,例如,IBM公司研发的RAID-1E、RAID-5E、RAID-5EE;康柏公司研发的双循环RAID-5,因康柏公司已被惠普公司收购,所以这种RAID级别也被称为惠普双循环。

近几年很多厂商又推出一种新的RAID级别,即RAID-6,因为RAID-6也不是标准RAID,所以厂商各有各的标准,其中包括Intel公司的P+Q双校验RAID-6、惠普公司的RAID-ADG、NetApp公司的双异或RAID-6(也称为RAID-DP),另外还有X-Code编码RAID-6、ZZS编码RAID-6、Park编码RAID-6、EVENODD编码RAID-6等。

从上面的介绍可以看出,RAID-6确实有太多的标准,但除了P+Q双校验RAID-6以外,其他形式的RAID-6都应该看作是"准RAID6"。

RAID数据恢复技术揭秘

RAID数据恢复技术揭秘

有了RAID卡,把RAID卡插到计算机主板上,再连接几块硬盘,就可以配置RAID了,下面演示一下这个过程。

首先启动计算机并进入RAID配置界面,如图1-4所示。

选择Configure下的New Configuration,开始一个新的配置。如果原先已经配置过

RAID,新的配置将会破坏原有配置,所以系统会询问是否继续,如图1-5所示。

RAID数据恢复技术揭秘

1.1.4 如何实现RAID(2)

选择Yes继续进行,然后进入通道的选择,该RAID卡支持双通道,选"通道-0",并把该通道的四块硬盘加入进来,如图1-6所示。

RAID数据恢复技术揭秘

RAID数据恢复技术揭秘

RAID-5配置好以后,还需要做一下Initialize(初始化),逻辑盘就可以使用了。

另外,除了可以用RAID卡创建RAID,目前还有很多主机板集成RAID功能,也可以创建RAID,其功能相当于RAID卡,但占CPU资源很严重,所以这种不能算纯粹的硬RAID,可以算半软半硬吧。

2.软RAID创建方法

除了使用RAID卡或者主板所带的芯片实现磁盘阵列外,还可以在一些操作系统中直接利用软件方式实现RAID功能,例如Windows 2000/XP/2003等系统中都内置了RAID功能。

为了使用软件RAID功能,首先必须将基本磁盘转换为动态磁盘(动态磁盘的详细讲解请参见第3章),下面以三块硬盘为例,讲解创建软RAID-5的过程。

(1)连接硬盘。

创建RAID-5卷至少需要三块硬盘,先在计算机上连接三块硬盘,连接好以后启动系统进入"磁盘管理",可以看到三块新接的4.3GB的硬盘,如图1-9所示。

RAID数据恢复技术揭秘

RAID数据恢复技术揭秘

RAID数据恢复技术揭秘

RAID数据恢复技术揭秘

到这里,一个软RAID-5的逻辑盘就创建成功了。

1.1.5 RAID专业术语详解

在RAID数据恢复中,会经常用到一些概念,为了便于对后面内容的学习,有必要先把这些概念理解清楚。

1.物理盘

物理盘是指创建RAID所用的每块独立的物理硬盘,创建为RAID之后,它们就称为RAID的成员盘。

2.逻辑盘

多块物理盘经RAID卡或者软RAID程序配置为RAID之后,多块物理盘就组成了一块新的硬盘,这个硬盘是由RAID控制器或RAID程序虚拟出来的,称为逻辑盘,也称作虚拟盘或容器。

3.逻辑卷

RAID中的逻辑卷是由逻辑盘形成的虚拟空间,也称为逻辑分区。

4.热备盘

热备盘是指RAID中空闲、加电并待机的硬盘,当RAID中某个成员盘发生故障后,RAID控制器能够自动用热备盘代替故障磁盘,并通过算法把原来储存在故障磁盘上的数据重建到热备盘上,保证RAID的完整性。

另外,系统管理员可以更换发生故障的硬盘,并把更换后的硬盘指定为新的热备盘。

5.去RAID化

RAID出现故障后,逻辑盘就无法被系统识别,这个时候物理盘可能部分有故障,也可能完全没有故障,为了恢复RAID中的数据,需要把物理盘从服务器的槽位上取下来进行检测和分析,物理盘离开了服务器的槽位,也就离开了RAID控制器,这些物理盘就被"去RAID化"了。

6.盘序

RAID数据恢复技术揭秘

多块物理盘在创建RAID时,配置程序会为这些物理盘安排一个先后顺序,RAID创建完成之后,这个顺序就被确定下来,不会再改变,这就是RAID的盘序。

有一点请注意,RAID的盘序并不一定跟物理盘插在服务器上的硬盘槽位顺序相符。为了对应关系的明确,在后面内容的讲解中,把RAID的盘序从0开始编排,RAID中盘序排在第一位的物理盘称为"0号盘",依次往后就是"1号盘"、"2号盘"等。

在恢复RAID数据前需要将物理盘"去RAID化",把这些RAID中的成员盘抽离服务器槽位时,应该按照它们的槽位顺序编上号码,并标明在物理盘上,一般是用硬盘0、硬盘1这种名称进行标示,但请注意,物理盘的这种顺序并不是RAID的"盘序",因为硬盘0并不一定是"0号盘",硬盘1也并不一定是 "1号盘"。

7.条带

在RAID创建过程中,配置程序把每块物理盘分割为一个一个的单元,每个单元的大小为2的N次方扇区,N取整数,是一个可变量,这个单元就是RAID的条带(Stripe),它是RAID处理数据的基本单位。在RAID配置时可以让配置程序默认条带大小,也可以手动选择条带大小。

条带也被称为"带区"或者"块",本书有时会用"块"这个说法代替"条带","块大小"也就是指每个条带包含的扇区数。

每块物理盘的条带都有一个编号,为了对应关系的明确,把条带编号也定义为从0开始,每块物理盘的第一个条带都称为0号条带,或者0号块,然后顺序往下编排。

8.盘数

构成RAID的物理盘的个数称为"盘数",也称为"条带数",在RAID配置程序中经常使用条带数表示RAID中的成员盘个数,如图1-15所示。

RAID数据恢复技术揭秘

RAID数据恢复技术揭秘

图1-16是一个RAID-0的结构,其中条带A、B、C、D都是每块成员盘中的0号条带,它们共同构成了"条带组0",也称为"0号条带组"。

RAID数据恢复技术揭秘

在图1-17中,两块物理盘由RAID控制器组建成RAID-0逻辑盘,RAID控制器将物理盘划分为一个个的条带,其中数字"0"是物理盘0的第一个条带,数字"2"是物理盘0的第二个条带,依此类推,一直划分到物理盘0的末尾;而数字"1"是物理盘1的第一个条带,数字"3"是物理盘1的第二个条带,依此类推,一直划分到物理盘1的末尾。RAID控制器把每块物理盘以条带为单位并行处理,虚拟出一个新的结构,就是RAID-0逻辑盘。

从图中可以清楚地看到,通过建立RAID-0,原先顺序写入的数据被分散到两块物理盘中同时进行读写,两块物理盘的并行操作使同一时间内磁盘读写的速度提升了2倍。

RAID-0只是单纯地提高读写性能,并没有为数据的可靠性提供保证,而且其中的任何一个物理盘失效都将影响到所有数据,因此,RAID-0不能应用于数据安全性要求高的场合。

1.2.2 RAID-0故障原因分析

这里说的RAID-0故障,是指RAID-0逻辑盘丢失或不可访问。导致RAID-0故障的原因主要有以下几种:

1.RAID控制器出现物理故障

RAID控制器是一块硬件卡,如果这块卡出现物理故障,将不能被计算机识别,也就无法完成对RAID-0中各个物理成员盘的控制,在这种情况下,通过RAID控制器虚拟出来的逻辑盘自然就不存在了。

2.RAID信息出错

对于硬RAID-0来说,RAID控制器将物理盘配置为RAID-0后,会生成一些参数,包括该RAID-0的盘序、条带大小、RAID-0在每块物理盘中的起始地址等,还会记录有关该RAID-0的相关信息,包括组成该RAID-0的物理盘数目,物理盘的容量大小等,所有这些信息和参数就被称为RAID信息,也称为RAID元数据,它们会被保存到RAID控制器中,有时候也会保存到RAID-0的成员盘中。

对于软RAID-0来说,同样具有上面提到的RAID信息,这些信息一般都存放在RAID-0的成员盘中。

RAID数据恢复技术揭秘

RAID数据恢复技术揭秘

对RAID-0原逻辑盘中的数据进行恢复,必须要把所有物理盘重组,因为RAID-0已经不可用,所以先把物理盘从RAID控制器中取出来,即"去RAID化",作为单盘进行分析。

对于单块物理盘,如图1-18中的硬盘0,其中的数据条带为A、E、I、M,硬盘1中的数据条带为B、F、J、N,都是部分数据,只有把四块物理盘中的数据按照A、B、C、D、E、F、G、H…的条带顺序拼接好,才是原RAID-0逻辑盘中完整的数据。

那么如何按顺序拼接四块物理盘中的数据呢?在这里有两个因素很重要,一个是

RAID-0中每个条带的大小,也就是A、B等这些数据块所占用的扇区数;另一个因素是RAID-0中硬盘的排列顺序,也就是说哪块物理盘是RAID-0中的第一块盘,哪块物理盘是RAID-0中的第二块盘等。

以图1-18中的RAID-0为例,假设条带的大小为16个扇区,硬盘的顺序就按照图中的排列顺序,那么只要到硬盘0中取0~15扇区的数据,再到硬盘1中取0~15扇区的数据,再到硬盘2中取0~15扇区的数据,再到硬盘3中取0~15扇区的数据,接下来再回到硬盘0中取16~31扇区的数据,就这样依次按顺序取下去,把所有取出来的数据按照顺序衔接成一个镜像文件,或者是镜像盘,这就成为完整的原RAID-0逻辑盘的结构了,直接访问这个重组出来的镜像文件或镜像盘,就得到了原RAID-0逻辑盘中的数据。

1.3 RAID-1技术详解

RAID-1通过磁盘数据镜像实现数据的冗余,在两块磁盘上产生互为备份的数据,当其中一块成员盘出现故障时,系统还可以从另外一块成员盘中读取数据,因此RAID-1可以提供更好的冗余性。

1.3.1 RAID-1数据组织原理

RAID-1又被称为磁盘镜像,需要两个物理盘共同构建,使用磁盘镜像(Disk

Mirroring)技术,方法是在工作磁盘(Working Disk)之外再加一额外的备份磁盘

(Backup Disk),两个磁盘所储存的数据完全一样,数据写入工作磁盘的同时亦写入备份磁盘,也就是将一块物理盘的内容完全复制到另一块物理盘上,所以两块物理盘所构成的RAID-1阵列,其容量仅等于一块硬盘的容量,其数据分布情况如图1-19所示。

RAID数据恢复技术揭秘

RAID-1是磁盘阵列中单位成本最高的,但提供了很高的数据安全性和可用性。当一个物理盘失效时,系统可以自动切换到镜像磁盘上读写,而不需要重组失效的数据。

虽然RAID-0可以提供更多的空间和更好的读写性能,但是整个系统是非常不可靠的,如果出现故障,无法进行任何补救。所以,RAID-0一般只是在那些对数据安全性要求不高的情况下才被人们使用。而RAID-1和RAID-0截然不同,其技术重点全部放在如何能够在不影响性能的情况下最大限度的保证系统的可靠性和可修复性上。

RAID-1是所有RAID等级中实现成本最高的一种,尽管如此,人们还是选择RAID-1来保存那些关键性的重要数据。

1.3.2 RAID-1故障原因分析

这里说的RAID-1故障,是指RAID-1逻辑盘丢失或不可访问。导致RAID-1故障的原因主要有以下几种:

1.RAID控制器出现物理故障

RAID控制器如果出现物理故障,将不能被计算机识别,也就无法完成对RAID-1中各个物理成员盘的控制,在这种情况下,通过RAID控制器虚拟出来的逻辑盘自然就不存在了。

RAID数据恢复技术揭秘

2.RAID信息出错

对于硬RAID-1来说,RAID控制器将物理盘配置为RAID-1后,会记录有关该RAID-1的相关信息,包括组成该RAID-1的物理盘数目、物理盘的容量大小、哪块物理盘为工作磁盘、哪块物理盘为镜像磁盘、RAID-1在每块物理盘中的起始地址等,所有这些信息被称为RAID信息,也称为RAID元数据,它们会被保存到RAID控制器中,有时候也会保存到RAID-1的成员盘中。

对于软RAID-1来说,同样具有上面提到的RAID信息,这些信息一般都存放在RAID-1的成员盘中。

RAID信息出错就是指该RAID-1的配置信息出现错误,导致RAID程序不能正确地组织管理RAID-1中的成员盘,从而导致RAID-1逻辑盘丢失或不能访问。

3.RAID-1成员盘出现物理故障

RAID-1可以允许其中一块成员盘离线,如果RAID-1中的某一块成员盘出现物理故障,比如电路损坏、磁头损坏、固件损坏、出现坏扇区等,该成员盘就不能正常使用,但剩下的一块成员盘中的数据完好无损,RAID-1还不会崩溃。

如果系统管理员没有及时替换出现故障的成员盘,当另一块成员盘再出现故障离线后,RAID-1将彻底崩溃。

4.人为误操作

如果误将RAID-1中的两块成员盘都拔出,或不小心删除了RAID-1的配置信息等,都会造成RAID-1崩溃。

1.3.3 RAID-1数据恢复思路

RAID-1是所有RAID中最简单的一种,以图1-20中的RAID-1结构为例,从图中可以看出,RAID-1中两块硬盘互为镜像,所有数据都是完全一样的,如果是RAID控制器故障或RAID信息出错导致RAID-1的数据无法访问,只要将两块物理盘中的一块从服务器上拆下来,作为单独的硬盘接在一台计算机上,就很容易将数据恢复出来。

RAID数据恢复技术揭秘

如果RAID-1中一块硬盘出现故障,不会影响服务器的运行,只要把故障硬盘更换为一块好的硬盘就可以了。如果没有及时更换,导致第二块硬盘也出现故障,这时RAID-1就会失效,因为先出现故障的硬盘中的数据已经不完整,所以不能以第一块硬盘为基准进行数据恢复,而应该用后出现故障的硬盘进行数据恢复,一般情况下都能够完全恢复出所有的数据。

1.4 RAID-10技术详解

RAID-10这种结构是两个镜像结构加一个带区结构,也是为了使RAID-0和RAID-1的优势互补,达到既安全又高速的目的。

1.4.1 RAID-10数据组织原理

RAID 1+0也被称为RAID-10标准,实际是将RAID-1和RAID-0结合的产物,其数据分布情况如图1-21所示。

RAID数据恢复技术揭秘

RAID-10至少需要四块硬盘才能构建,它的优点是同时拥有RAID-0的超凡速度和

RAID-1的高数据可靠性,但是磁盘的利用率比较低。

RAID-10主要用于容量不大,但要求速度和差错控制的数据库中。

1.4.2 RAID-10故障原因分析

这里说的RAID-10故障,是指RAID-10逻辑盘丢失或不可访问。导致RAID-10故障的原因主要有以下几种:

1.RAID控制器出现物理故障

RAID控制器如果出现物理故障,将不能被计算机识别,也就无法完成对RAID-10中各个物理成员盘的控制,在这种情况下,通过RAID控制器虚拟出来的逻辑盘自然就不存在了。

2.RAID信息出错

RAID控制器将物理盘配置为RAID-10后,会生成一些参数,包括该RAID-10的盘序、条带大小、RAID-10在每块物理盘中的起始地址等,还会记录有关该RAID-10的相关信息,

本文来源:https://www.bwwdw.com/article/s9x1.html

Top