实战演练IT灾难恢复
北方电力本地/异地容灾系统的建设
北方联合电力公司信息中心 刘平光
2008年上半年,北方联合电力公司采用远程异步镜像和连续数据保护等先进技术,建设了数据中心本地/异地容灾系统,并在夕对该系统进行了测试和演练。
测试和演练包括测试链路故障、主机故障、阵列故障、应用系统误操作和误删除故障、SAN系统网络及单机设备故障,还进行了生产系统的灾难模拟,顺利将ERP应用系统切换到容灾中心。所有测试都成功完成,恢复点目标(RPO)和恢复时间目标(RTO)值达到预先设计的要求。同时,上述各种数据保护和切换措施对最终用户完全透明,用户端不需更改任何设置,即可访问恢复后的应用系统。
建设背景
北方电力成立后,在生产、基建、经营等各方面都取得了辉煌的成就,但在市场竞争中面临着巨大的考验,公司决定采用国际先进的信息技术和手段,利用先进的管理思想和理念内部挖潜,向管理要效益,提高公司的管控能力,走出一条能够使北方公司做强做大的健康发展之路。
四年来,我们逐步建成了覆盖公司本部至25个二级单位的信息化基础平台和信息化应用系统,并成为公司生产经营管理中不能离开的工具。因此,信息系统的容灾备份势在必行。
技术选择
通过对公司之前的信息平台及相关技术进行分析,我们决定建立一个近线虚拟存储系统,应用系统可以在不同的存储设备上透明地切换。近线虚拟存储系统第一期主要是对核心数据库小型机的数据进行备份,其次要兼顾OA、门户、基建等服务器的近线数据存储和备份。在数据保护技术的选择上,针对CDP技术,我们的目标是选择能够恢复任意时间点数据的TrueCDP技术。
此外,我们还考虑到:新的ERP主存储要具有承担数据中心存储池的能力;将主存储设备内的数据连续备份到近端的存储设备上;要求该套系统可以兼容其他厂家的存储产品;当主存储发生故障时可以手动切换到近端备份存储设备;可保障主存储发生故障后数据丢失量不大于10分钟;新系统要支持异构存储环境,可以支持对Windows、HP Unix、AIX、Linux等操作系统在存储设备上的备份恢复;数据迁移要安全可靠,不允许数据丢失等技术因素。
通过对主流的供应商进行综合考察,我们认为,EMC的解决方案最符合要求它的CLARiiON CX3存储系统性能不错,应用很流行;RecoverPoint软件能够恢复任意时间点的数据;MirrorView远程复制软件可以直接在存储设备之间进行,不需要主机,大大减轻主机的负担;其在兼容性和异构支持方面表现都不错。所以,我们最后选择了EMC的方案。现在来看,无论是对技术方向还是供应商的选择,结果都还不错。
系统概况
北方联合电力公司数据中心本地/异地容灾系统主要包括本地机房的近线复制和远程机房的异步复制两个部分。系统架构如图所示。
容灾中心和总部各采用2台HP主机和2台Cisco MDS 9000系列智能交换机,互为备份,组成高性能、全冗余的SAN。容灾中心与总部之间直接通过Cisco MDS 9000连接,采用FCoIP协议,链路带宽为622Mbps。
在总部机房,采用一台EMC CLARiiON CX3-80作为数据存储主阵列,以HP EVA6000作为近线复制存储。采用连续数据保护(CDP)技术,以2台EMC Recover Point 应用装置组成群集,负责把HP主机到CX3-80的写数据重定向到EVA6000上。
容灾中心设在200公里以外的达拉特电厂,主要设备包括1台EMC CLARiiON CX3-20和2台HP主机,为总部机房提供远程的应用级容灾保护。其核心技术采用EMC公司的远程异步镜像(MirrorView),结合Cisco 9016光纤交换机的特性,可以由CX3-80直接把生产数据同步到CX3-20上,不增加主机负担。
容灾系统还给我们带来了另一个收获。由于容灾系统和生产系统的数据是同步的,我们可以将备份系统用做仿真测试系统。上马新系统时,可以在测试系统上进行,新旧系统并行一段时间后正式切换,这一功能使我们节约了200多万元投资成本。
下一步,我们计划把OA、信息门户等更多的系统整合到主存储中来,充分发挥主存储作为存储池的作用,简化管理,并让更多的系统得到保护。同时,将在信息安全、应用系统整合及统一身份认证等方面做进一步的工作。
北方联合电力公司
北方联合电力有限责任公司是内蒙古电力体制改革实行厂网分开背景下组建的发电集团公司。它由中国华能集团控股,内蒙古电力投资有限公司、中国神华集团公司、中信泰富有限公司参股组建。公司成立于2004年,下属有15个火电厂、1个风电公司,均分布在内蒙古自治区境内。目前发电装机容量为1414.4万千瓦,其中火电1401.2万千瓦,风电13.2 万千瓦。