在网络飞速发展的今天,选择一种适合需求的高性能数据存储方式变得十分重要。在一些企事业中,即使是网络管理员。数据存储的观念也尚未被普遍接受。能够正确选择相应的储存设备和技术,进行经济而可靠的数据存储与恢复,从而避免可能发生的重大损失。因此。企事业必须有一套正确的数据存储与恢复系统的方案。RAID(Redundant Array of Inexpensive Disks)技术就是网络数据存储的一种较佳选择方案。
RAID网络存储技术主要利用网络技术实现信息的异地储存,即电子数据不再直接存储在本地客户端上。而是储存在远端的服务器上,并且还可以通过网络保存在与远端服务器相连的专门设备上。由于RAID存储技术的方式很多.在具体实现上还需进一步的研究。
2 RAlD存储技术
RAID是指廉价(独立)磁盘阵列,所谓“磁盘阵列”是指多张磁盘连成一个阵列上,然后,以某种方式书写磁盘,这种方式可以在一张或多张磁盘组之间提供数据。
从主机的角度看,控制器使得整个磁盘组就像一片又快、又大、又可靠的虚拟磁盘。它的初衷主要是为大型网络服务器提供高端的存储功能和冗余的数据安全.在系统中RAID被看作是一个逻辑分区.但它是由多个硬盘组成的,通过在多个硬盘上同时储存和读取数据来大幅度提高存储系统的数据吞吐量。而且在很多RAID模式中都有较为完备的、相互校验与恢复的措施,甚至是直接相互的镜像存储。当数据灾难发生时可以自动修复,从而大大提高7 RAID系统的容错度,稳定了系统的冗余性。
3 RAID技术规范
RAID技术是一种工业标准。通常将组成磁盘阵列的不同方式分为RAID级别。随着RAID技术的不断发展。现在已拥有了以RAID 0到RAID 6七种基本的级别。另外。还有一些基本RAID级别的组合形式.如RAID 10、RAID 50等。现将RAID级别在应用中的实现作进一步的研究。
(1)RAID 0:是连续以位或字节为单位分割数据,并行读写于多个磁盘上。因此具有很高的数据传输速率,但它没有数据冗余。它只是单纯地提高性能,而且其中的一个磁盘失效将影响到所有数据。因此,它不能应用于数据安全性高的场合。
(2)RAID 1:通常被称为RAID镜像,是通过磁盘数据镜像实现数据冗余,在成对的独立磁盘上产生互为备份的数据,即所有数据都进行百分之百的备份。当原始数据繁忙时,可直接从镜像磁盘上读写,而不需要重组失效数据。
(3)RAID0+1:也称为RAID 1 0标准,至少需要4块硬盘才可以实现,不过它综合了RAID 0和RAID 1的特点.将独立磁盘配置成RAID 0,两套完整的RAID 0互换镜像。但构建RAID 0+1阵列的成本投入大,数据空间利用率只有50%。
(4)RAID 2:是按位分配数据到多个驱动器的,在写入数据时一个磁盘上保存数据的各个位。同时把一个数据不同的位运算到海明校验码保存在另一组磁盘上,在数据发生错误的情况下将错误校正。这种编码技术需要多个磁盘存放检查及恢复信息,使得RAID 2技术实施更复杂、速度最慢,因此在商业环境中很少使用,最适合用于诸如图像之类的应用。
(5)RAID 3:通常是按字节将数据划分为条纹分配在许多驱动器上,虽然也可按位划分,但它在阵列时专用一个驱动器保存奇偶校验信息,因此它同RAID 2非常类似,区别在于它使用简单的奇偶校验,并用单块磁盘存放奇偶校验信息。如果一块磁盘失效,奇偶盘及其他数据盘可以重新产生数据;如果奇偶校验失效,则不影响数据使用,但奇偶盘会成为写操作的瓶颈。
(6)RAID 4:除了按扇区而不是按字节对数据划分条纹外,RAID 4与RAID 3相似,同样也将数据条块化并分布于不同的磁盘上,但条块单位为块或记录。它使用一块磁盘作为奇偶校验盘,这时奇偶校验盘会成为写操作的瓶颈。因此它在商业环境中也很少使用。
(7)RAID 5:是把数据和相对应的奇偶校验信息存储到组成RAID5的各个磁盘上,并且奇偶校验信息和相对应的数据分别存储在不同磁盘上。它使用一种特殊算法,可以计算出任何一个区域校验块的存储位置。这样就可以确保对校验块的任何读写操作都会在所有RAID磁盘中进行均衡,从而消除产生瓶颈的可能。它读出效率很高,写入效率一般,块式的集体访问效率较佳,但控制器的设计也相当困难。
(8)RAID 6:与RAID 5相比,它增加了第二个独立的奇偶校验信息块。两个独立的奇偶校验系统使用不同的算法,数据的可靠性非常高,即使两块磁盘同时失效也不会影响数据的使用。相对于RAID 5有更大的写“损失”,因此“写性能”非常差。
(9)RAID 7:这是一种新RAID标准,其自身带有智能化实时操作系统和用于存储管理的软件工具,可完全独立于主机运行,不占用主机CPU资源。它采用优化的高速数据传送磁盘结构,所有的I/O传送均是同步进行的,可以分别控制.这样提高了系统的并行性和系统访问数据的速度;每个磁盘都带有高速缓冲存储器,实时操作系统可以使用任何操作芯片,达到不同实时系统需要。当多用户访问系统时。可以连续多台主机,访问时间几乎接近于零。
4 RAID级别问的关系
RAID0—5级的描述、速度与容错功能如下表所示:
5RAID技术的特点
从RAID级别的发展与应用,归纳起来主要有如下特点:
(1)RAID控制器通过磁盘阵列的并行数据读写。克服了磁盘机电设计的限制,大大提高了存取速度。即如果是由四张磁盘组成的阵列,其读写速度几乎是单盘的四倍,从而为不同的应用服务。
(2)RAID系统提供了大容量的数据存储,而且这张磁盘上的数据对于主机来说随时可用。复杂的RAID系统可允许用户通过控制器发的数据途径组威多盘级连。在一个充分设置的RAID中。它的高性能控制器可同时进行90张盘的寻址操作。
(3)RAID系统运用奇偶校验技术提高数据的可靠性。在这种体系中,当RAID控制器在磁盘上写数据时,它还会记录下相应的奇偶校验位冗余数据。如果盘片失效,这个奇偶信息可使RAID控制器在不降低性能的情况下重新计算丢失的信息。
6结束语
RAID技术可以通过软件或硬件实现。软件实现RAID需要一些网络操作系统的支持,可以使用标准的SCSl适配卡和管理驱动器来完成。由于是操作系统下实现RAID技术,因此软件RAID不能保护系统盘,并且当系统崩溃需要重新安装时。RAID信息也会丢失;硬件RAID是采用集成的阵列卡或专用的阵列卡来控制硬盘驱动器的,这样可以极大地节省服务器系统CPU和操作的资源,从而使网络服务器的性能获得很大的提高。RAID控制器与主系统之间有连接存取接口(如SCSI、IDE和SATA)的信道。在主机系统的存取接El中是一个独立的直接存取储存体,并且可以有不止一个逻辑盘卡,都支持在线更换、热插拔交换。同时在部分操作系统下实现软件监控和管理。因此,依据企事业的实际,实现RAID技术的数据储存。