这个问题你必须清楚自己:为了可用性增加一个“9”而投入额外的资金值得么?是否可以证明正常运行时间真的需要从99.99%提升到99.999%?
两个重要的计算帮助你作出这一决定(至少从财务角度):升级后的可用性和停机成本。本文主要讨论停机成本。
如果您的正常运行时间对业务并没有太大影响,换句话说,停机几个小时甚至几天也不会对您的业务产生真正的影响,只是有些不方便而已。这种情况下您并有必要对基础设施进行更多的投资以防止停机,因为这种投资根本没有足够的回报来证明其价值。
但是如果即便是停机几秒钟也会对您的业务产生重创的话,那么你就需要考量应该花多少钱来增加您数据中心的可用性。要做到这一点,你必须计算出一旦出现停机情况您的公司会损失多少?
准确地测量出停机成本要取决于您的业务类型。如果您的公司是进行研究和开发的,例如您的业务重点是网上销售那么您就必须估算那些情况下会出现停机现象,很多别人不需要考虑的因素您也要纳入考虑范围。
下面列表中包含了许多你计算停机成本时需要考虑的因素。大多数企业只需要考虑这些因素中的一项,针对特殊情况再确定是否需要考虑其他因素。
基础的员工成本:如果您的员工的工作时间段是在数据中心的正常运行时间内,那么每次的停机时间的成本就等于停机时间内所支付员工工资的成本,应为停机时间内员工无法工作,你支付的工资基本上没有效益产生。别忘了包括成本效益。
设施成本。即使您的数据已经关闭,员工无法工作,您也必须支付基础设施的相关费用。例如您可能继续使用中央空调,照明和支付其他公共费用。
商业损失。如果您的业务完全依赖与网站,那么停机就意味着这些客户将无法购买您的商品或者服务。事实上,或许他们会等待您修复后再回来继续采购,但另一方面,他们也会简单地去给别的网站直接购买。所以,这部分损失的业务额也是您的停机成本。
数据损失。停机时间不仅仅意味着你要支付无谓的人工成本,在某些情况下,您可能会永远失去宝贵的数据。这些资料的搜集和开发您都投入了时间和金钱,如果它被保持或按计划交付,那么价值是会提升的。
恢复费用。一旦您的数据中心恢复运行,损失可能会继续上升。例如:先关设施工作人员必须继续进行修理工作,或者其他和停机相关的任务。
这些成本中的大部分都取决于数据中心停机时间的长短。用这种方法计算出每分钟的损失(也可以以每秒钟、每小时、每天为单位。)然后乘以每年的停机总时间,以分钟为单位(或者其他时间单位)。如果你知道你一年中对于停机时间的期望值,你就可以估算出你的停机成本。相比之下,用提升基础设施来增加可靠性的投资价值就一目了然了。