IDG Research Service 最近发布了一份标题为“Disaster Recovery Trends and Metrics”的报告。报告称,多数企业无法承受超过 4 小时的停机事故。数据保护和灾难恢复 (DR) 规划是每一位数据中心经理日程上的关键事项,因为构建具有弹性的IT基础架构是其关键的职责之一。
美国飞康软件公司产品营销高级总监Darrell Riddle表示:“原因很简单,数据和应用是企业所有关键职能部门的基础。没有这些数据和应用,公司运营将嘎然而止。”例如,如果公司网站不能正常运行,客户无法访问服务信息或者购买产品,则销售团队将无法获取潜在客户的详细情况,财务部门无法平衡预算或开据支票,需要呈报 CEO 的报告也会丢失。
IT 部门无法预测这些问题会在什么时间出现。尽管自然灾难具有一定的可预测性,但多数数据中心故障都与恶意行为或简单的人为错误有关,比如某位员工错误地按了一个按钮,结果就有可能是主服务器立即宕机。借助数据保护、复制技术和自动化灾难恢复解决方案,数据中心管理者就能构建起一种具备灵活性的基础架构,从而在发生灾难或故障时保证数据和应用的持续可用,避免停机故障。如上所述,停机是企业需要全力避免的事,如果停机事故无法避免,数据中心经理必须确保能顺利恢复而不丢失任何数据。
目前,解决办法似乎非常简单,只需安装某种技术和业务活动监视功能 (BAM),企业就具备了实时数据保护和灾难恢复的能力。然而情况并非如此简单,某些技术虽然减轻了数据中心的工作难度,但是,要为整个基础架构提供数据保护和灾难恢复服务则面临重重困难。造成这些困难的原因是数据量不断增长,环境混合性不断突显,预算、人力却不断缩减。但数据中心经理却不能放弃这些解决方案,因为它们相当于数据中心的保险单。就如房屋里要安装一氧化碳检测仪和火警报警器一样,虽然这些报警器并不能提高住宅的整体价值,却可以保护房屋和居民不受极端伤害。规划有效的灾难恢复和数据复制技术可以确保数据中心全天候无故障运行。
连续数据保护
通过数据快照技术将数据连续不断地复制到本地灾难恢复站点,则可以让数据中心经理变得轻松一些,因为即使发生停电事故,也可以在数分钟之内,将最新的数据拷贝保护并保存起来以供恢复。连续数据保护使公司从定期备份走向了持续备份模式,这意味着数据丢失极少、甚至为零。就如行业专家 Chris Poelker在年初的《Data Center Journal》 上发表的文章“How to Justify the Cost of New Backup and DR Solutions”中所指出的那样,连续数据保护技术在备份和减少停机时间方面的效益应该分阶段评估。
自动化灾难恢复
灾难恢复规划不仅仅是通过连续数据保护技术来备份或复制数据。有效的灾难恢复将应用、数据库和数据组合成一种数据中心服务。其原因很明显,如果只恢复数据但数据所属的应用却不可用,则数据也是毫无用处的。数据中心经理必须从 IT 服务的角度来看待灾难恢复。
目前,越来越多的企业依赖于已经部署的应用与数据灾难恢复解决方案。随着数据量的不断增长以及虚拟化的日益普及,诸如将数据复制到单台服务器、虚拟带库、物理磁带、基于映像的备份等单点解决方案都无法做到万无一失。这些传统方法在恢复数据和应用时需要执行数百个步骤,每个步骤都要求重启服务器、应用和基础设施。如果恢复过程中发生一次错误,整个恢复过程的耗时可能会增加一倍。为了解决这些问题,企业已开始寻求更有效的复制技术和自动化灾难恢复技术。自动化灾难恢复技术将这些复杂的步骤自动化,了解整个应用和数据恢复过程的具体顺序、过程和程序。事实上,前述 IDG Research Service 报告的受访者表示,随着各种规模的企业开始抛弃传统备份方法,自动化复制技术将在今后 18 个月中占据更大的市场份额。
收获效益
采用这些技术后,数据中心团队可以获得众多优势,最显著者莫过于无人为干预的系统恢复过程。类似于办公用品店使用的红色大按钮,数据中心经理只需要点击屏幕上的一个按钮即可启动自动化灾难恢复解决方案。鼠标一点即可启动一系列步骤,将主数据中心故障服务器的信息发送到新数据中心服务器上,并重新装入新的物理机或虚拟机。
通过整合的复制技术和自动化灾难恢复技术,数据中心经理则可以免除所有后顾之忧。他们知道,有了自动化灾难恢复,就不大可能有紧急来电在凌晨 2 点将他们无情地叫醒,称服务器已停机超过 1 小时,愤怒的客户打电话称无法访问网站。数据中心经理的压力将得到缓解,取而代之,他们可以集中精力处理更多战略项目,处理更多紧急情况。
虽然实施连续数据保护和自动化灾难恢复技术在大幅节省成本这方面不能马上见到效果,但数据中心经理却可以保证,无论是海边吹来的飓风还是用吸尘器打扫办公室的清洁工拔掉了主服务器电源,在问题不可避免之时,都可以快速予以解决。点击按钮恢复数据和应用之后,数据中心经理便可坐下来放松自己了,因为他们知道持久耐用、极富灵活性的的数据中心基础架构在正常地工作。