目前,国内校园网建设如火如荼,各大高校、中小学校都建立起了自己的信息网络中心。校园网作为整个学校信息化建设的重要基础设施,它是一个高速、开放、智能的计算机信息网络平台,公共服务体系和各种基础设施建设的平台。随着校园网建设的不断发展,应用种类不断增长,应用的数据也在不断增长,校园网的数据中心的重要性日益凸显,数据存储的矛盾也日渐突出。如何保证数据中心的数据安全成为众多校园网建设中的一个严峻挑战。如何有效地存储、备份和管理这些业务系统的海量数据,并使管理达到功能完备和手段的自动化,减少人为的错误因素和设备故障所造成的业务损失。由于网络存储系统建设费用高,许多资金紧张的学校根本不想在这方面投入,也有许多学校在校园网存储系统建设中投入了大量资金,但由于技术力量不够而导致实际效果不明显。因此本文提出设计一个符合本校校情,既实用又相对低廉的校园网数据存储方案,确保校园应用数据的安全性和可用性。
现状分析
多年建设的校园网络已经积累了大量的重要信息数据,已经建设完成的一些重要软件系统的数据和应用也急需备份服务的支持。安全的数据交换和共享平台的重要性凸显,它不仅要求有大容量的存储设备,而且要求数据的存储非常安全。而目前校园网的的存储资源大多是各自分立的,实验室、机房有其独立的服务器和数据存储、各院系和部门也有其独立的服务器和数据存储。而他们由于不具备存储专业知识,他们对简易性的重视在高性能和高可用性之上,并对成本比较敏感,需要集成文件服务、存储阵列功能和数据保护且需要成本低、实用的解决方案,因此大多采取手动、离线备份、服务器RAID技术以及数据容灾技术来保护数据的安全。
有些学校网络信息中心投入了大量资金建立了数据存储系统,并且具有远程容灾的功能,但这个数据存储系统基本只用来存储全校级的公共数据,未能把学校二级单位的数据整合到网络中心数据存储系统中,未真正实现全校数据存储的统一,采取单一备份策略,系统容灾多从系统运营的角度出发,企图构建支持运营系统自动切换的容灾系统,这往往需要大量的资金投入和漫长的建设周期,结果可控性差。致使投入大量资金建设的数据存储系统利用率低下,效果不理想。整个学校存在大量的服务器,各服务器利用率不到30%,造成大量资金的浪费。
由于资金比较短缺、存储专业知识的匮乏,很多学校则根本未建立数据存储,没有真正实施存储区域网络,因为存储区域网络虽然可以解决许多难题,但实施这样一个网络还涉及时间、资金和技术问题,因此许多学校主要是依靠RAID 技术来保数据安全,但RAID 技术是一种通用的在线存储技术。RAID能够恢复单个失败的介质,但不能保证恢复两个同时失败的介质,出现多个介质失败的情况,RAID本身也就失效了。仅采用磁盘阵列作为备份设备风险很大,依靠RAID保护全部数据,等于把鸡蛋放在一个篮子里,篮子烂掉了,鸡蛋就全碎了。
方案设计
总体上看,目前校园网络存储方法和手段安全性低,存储策略单一, 管理繁锁而且费时,可靠性低,可操作性不强,数据损坏后,恢复时间长,效果差,未能实现真正意义上的数据存储统一。针对此种现状我们将RAID技术、虚拟存储技术和数据容灾技术有机融合,建立一个立体化的校园网络数据存储方案。该方案主要包括三个存储层,每个层又采取两种不同的存储方式,具体设计模型如图1所示。
图1 立体化数据存储模型
该方案设计思想是构建三个层面的存储平台,为物理存储层、虚拟存储层、数据容灾备份层。在物理存储层利用RAID技术实现磁盘冗余,保护硬件资源;在虚拟存储层利用虚拟化技术整个网络中的服务器磁盘聚集为一个虚拟的存储池,对磁盘统一分配、集中管理,利用虚拟平台备份技术对操作系统平台备份,利用批处理自动备份程序对应用系统关键数据进行备份;数据容灾备份层利用IP SAN存储技术实现本地存储与异地存储进行实时同步数据备份,当本地数据中心系统发生灾难时,可以使用备份容灾中心的备份数据进行恢复,确保关键数据备份的安全性。
物理存储层设计
对于学校各二级单位存储介质一般是服务器中的硬盘,服务器中的硬盘是数据的载体,但往往由于二级单位管理人员技术缺乏,常常因误删除、误格式化、误分区、误克隆、病毒破坏导致服务器中的数据丢失,甚至有时因硬盘损坏造成大面积数据丢失。因此大多数是采取离线手工备份的方式,但这种方式工作量大,而且恢复慢,并且随着数据呈跳跃性增长,备份磁盘越来越多。因此对于二级单位保护服务器数据最简单、效果又非常好的方法是采用RAID技术来实现磁盘的冗余,当服务器磁盘中的数据丢失或者磁盘损坏可以快速地恢复,对于服务器中一些敏感、关键数据在实现RAID技术后,再采用手工离线备份,而不是对整个磁盘中的数据进行备份,这样可以大大减少后备磁盘成本。
磁盘阵列有两种方式可以实现,那就是“软件阵列”与“硬件阵列”。软件阵列是指通过网络操作系统自身提供的磁盘管理功能将连接的普通SCSI卡上的多块硬盘配置成逻辑盘,组成阵列。
如微软的Win -dows NT/2000 Server/Server 2003和NetVoll的NetWare两种操作系统都可以提供软件阵列功能,其中WindowsNT/2000 Server/Server2003可以提供RAID 0,RAID 1,RAID5;NetWare操作系统可以实现RAID 1功能。软件阵列可以提供数据冗余功能,但是磁盘子系统的性能会有所降低。硬件阵列是使用专门的磁盘阵列卡来实现的,硬件阵列能够提供在线扩容、动态修改阵列级别、自动数据恢复、驱动器漫游、超高速缓冲等功能。它能提供性能、数据保护、可靠性、可用性和可管理性的解决方案。磁盘阵列卡拥有一个专门的处理器和专门的存贮器,用于高速处理和高速缓冲数据。这样一来,服务器对磁盘的操作就直接通过磁盘阵列卡来进行,因此不需要大量的CPU及系统内存资源,不会降低磁盘子系统的性能。考虑到现在的非入门级服务器几乎都提供磁盘阵列卡,不管是集成在主板上或非集成的都能轻松实现阵列功能,因此在本方案中采用硬件阵列RAID 5 技术来实现物理层存储安全。
虚拟存储层设计
虚拟存储层的设计思想是把学校分散的服务器磁盘集中管理,统一使用。虚拟化技术是在实体主机的硬件系统和操作系统之间建立一个称为虚拟机监视器( VirtualMachine Monitor, VMM ) 的软件监控层, 用来阻隔操作系统与硬件系统的直接通信。通过VMM的分析和转换后, 再转向控制硬件系统。由于VMM对系统指令的拦截和转换的特殊作用, 使得在VMM 上可同时支持多个异构操作系统的运行。在此我们在每台服务器上安装VMware ESX Server,利用逻辑资源池技术, 将全校所有服务器磁盘资源聚集为一个磁盘池,然后使用Vi rtualCenter (虚拟中心 )对ESX Server进行集中管理、合理分配, 再将其按需动态分配到Guest OS上。使用Virtual Center (虚拟中心)创建虚拟机配置如WWW、FTP、Email等系统服务和分配应用软件,这些虚拟机资源随机存储到各磁盘,在物理环境不进行任何改变的情况下, 完成对系统综合资料的重新部署和分配, 甚至在无须中断服务的情况下, 实现指定虚拟机到实体主机的安全迁移。同时, Virtual Center还可通过服务的迁移实现零中断的底层硬件和存储维护。虚拟化以较低成本让管理人员做更有效的资源调度,并获得更好且安全周密的防护。当系统发生灾难时, 可以在最短的时间迅速复原系统的运作。
为了进一步提高存储利用率,虚拟存储层设计时我们扩展了自动精减配置技术,采用了一个虚拟存储在虚拟机间按需动态流动方式。该方式将一台服务器拥有的所有存储资源都整合到一个统一的存储池中,从存储池中创建逻辑卷,作为每个虚拟化机所拥有的虚拟存储空间。基于此,虚拟存储空间可以根据需要动态地扩展[3];另一方面,当整体存储空间紧张时,为了响应其它虚拟化机的虚拟存储空间的扩展与创建需求,也可以收缩某一虚拟化机所拥有的虚拟存储空间,回收其一部分空闲空间;若回收了空闲空间后资源仍然紧张,则可以向网络中的邻居节点(服务器磁盘)请求共享邻居节点的空闲空间。即存储空间可以由一个空闲空间较多的虚拟化机“流”向空闲空间紧张的虚拟化机。由此,采用自动精简配置技术,更能有效地提高存储利用率,进而降低存储开支和能耗,也更有利于异地存储模式。
为了保护各虚拟机中的敏感、关键数据,本设计中我们还利用批处理制作自动复制程序,然后采用任务计划功能启动自动备份软件实现各虚拟机中敏感、关键数据自动备份到备份服务器中。
数据容灾备份设计
考虑目前大多数高校校园网业务数据增长特点以及存在多种异构操作系统,而且考虑到经费问题,IP SAN性价比更高,可节约设备成本。IP SAN基本上可以满足近期的需求,并且IP SAN基于以太网,数据的访问、备份和恢复不影响LAN的性能,在有大量数据访问时,不会大幅度降低网络性能,带宽不受数据访问的影响。鉴于IPSAN的优势,本方案数据容灾备份设计采用IP SAN网络存储技术实现数据容灾,通过IP容灾技术来保证数据的安全。数据容灾使用两个存储器,在两者之间建立复制关系,一个放在本地,另一个放在异地。本地存储器供本地备份系统使用,异地灾备存储器实时复制本地备份存储器的关键数据。二者通过IP相连,构成完整的数据容灾系统。
1. 本地备份系统确保数据安全
存储备份必须保证足够小的备份窗口,对系统运营的影响要减少到最小。恢复更需要以最快的速度完成。本地有足够的带宽和资源,能够实现高速网络备份、LANfree等快速备份恢复模式。安装在本地网络中的存储备份设备,能实现备份本地数据,以及各种备份各异构系统,确保本地网络数据的安全。
2. 异地备份系统实现数据容灾
运营数据和备份数据都在本地网络存放,显然是不够安全的,如果本地遭到灾害,所有数据都处在危险之中。关键数据必须复制到另外的备份存储器中,并且两个备份存储器分隔足够远的距离,通过充足带宽的IP网络相连。在本地介质失效后,及时从远端恢复失效的数据到本地存储器,就可实现异地数据容灾,解决介质安全问题,数据不再惧怕自然灾害。
目前,数据容灾系统建设的成本投入比较大,因此在选择容灾方案时一定要结合学校应用环境和预算等实际情况做出决定,选择适合本校的方案。
该立体化数据存储方案在作者学校实施以来,取得了很好的效果,主要表现在以下几个方面:
(1)本方案设计简单、可操作性强,甚至在资金比较紧张的情况下也可以实现。如RAID技术一般在购买服务器可集成,虚拟技术利用VMware ESX软件价格低廉,数据容灾备份只需购买两台存储设备,甚至可以采用批处理自动复制软件实现异地备份。
(2)提高了服务器的稳定性与数据的安全性,实现了复杂的数据应用如多数据库、多用户管理、多部门关键数据的存储。
(3)基于虚拟化技术,通过整合众多异构、廉价的服务器和存储设备,构建众多的虚拟化的实例,为学校提供持续不断的应用和存储服务,不仅可以满足学校的存储需求,而且也有效地减少了学校的存储开支和能耗。
(4)存储、备份和容灾技术的充分结合,构成一体化的数据容灾备份存储系统,使用基于以太网的IP SAN技术,在不对校园网做任何改动的情况轻松架构数据容灾备份平台,能满足较长时间的在线容量增长和性能扩展,管理维护简单。