现代企业的运营离不开数据。数据中心承载着数以千计的服务器,用于支持应用程序、提供信息以及实现多种流程的自动化。对于数据中心容量的需求一直没有减弱的迹象。数千台服务器一起开动会消耗大量电力,造成运营成本上升,导致全球温室气体不断增加。
我们的研究表明,通过更加严格的管理,公司可以将数据中心的能效提高一倍,从而降低成本并减少温室气体的排放。具体而言,公司需要更积极地管理技术资产,提高现有服务器的利用率水平;公司还需要更准确地预测业务需求对应用程序、服务器和数据中心设施容量的推动效应,以便控制不必要的资本和运营支出。
数据中心的效率是一个战略问题
企业建造和运营数据中心花费的资金在公司IT预算中占的比例不断上升,导致用于急需技术项目的预算越来越少。数据中心建造计划是董事会一级的决策。同时,监管部门和外部利益相关方也越来越关注公司管理自身碳足迹的方式。采用最佳实践不仅有助于公司减少污染,还能够提高它们作为良好企业公民的形象。一个成本高昂的问题
如今,公司进行的分析越来越复杂,客户要求实时访问账户,广大员工也在寻找新的技术密集型协作方法。因此,即使在经济放缓时,人们对于计算、存储和网络容量的需求也在继续增长。为了应对这一趋势,IT部门正不断增加计算资源。在美国,数据中心的服务器数量正在以每年约10%的速度增加。与此同时,在中国和印度等新兴市场,机构正在变得越来越复杂,更多的运营工作实现了自动化,同时有越来越多的外包数据业务在这里进行,因此数据中心的数量呈现出更快的增长态势。这种对计算资源无法抑制的需求,导致全球数据中心容量稳步上升。目前,这种增长并没有显露出即将结束的迹象,通常在经济衰退时期它只会进入温和增长状态。
这一增长已经导致了IT成本激增。如果将设施、存储设备、服务器和人员成本都计算在内,数据中心支出一般会占到企业IT总预算的25%。随着服务器数量不断增长,电价也正以高于收入和其他IT成本的速度攀升,上述比例只会日益提高。每年,运行这些设施的成本都在以高达20%的速度上升,而IT总支出的增长速度仅为6%,二者相差极为悬殊。
数据中心支出的不断增加,改变了许多企业的经济结构,尤其是金融、信息服务、媒体和电信公司等信息密集型企业。在过去5年中,成立一个大型企业数据中心所需的投资已经从1.5亿美元升至5亿美元。在IT密集型企业中,最大设施的造价正逼近10亿美元。这一支出挤占了新产品开发的资本,降低了某些数据密集型产品的经济效益,并降低了利润。此外,不断上升的能耗产生了更多、范围更广的碳足迹,导致了环境恶化。对于大多数服务行业,数据中心是企业最主要的温室气体排放来源。在2000到2006年间,用于存储和处理数据的电力翻倍,每个数据设施的平均耗电量相当于2.5万个家庭的总和。世界上共有4400万台服务器,消耗了总电力的0.5%。如今,数据中心的碳排放已经接近阿根廷和荷兰等国家的碳排放水平。仅仅在美国,到2010年数据中心的预计用电增长量就相当于要新建10座电厂的发电量。目前的预测显示,如果不对需求加以遏制,2020年全球数据中心的碳排放将是现在的4倍。
监管部门已经注意到这些发展趋势,正在督促公司拿出解决方案。美国环保署(EPA)建议,作为建立运营效率标准的第一步,大型数据中心应当使用能量计。同时,欧盟也发布了一套自愿执行的行为准则,其中介绍了以较高的能效运行数据中心的最佳实践。随着数据中心排放量的持续上升,政府可能会为了减排而施加更大的压力。
影响深远的挑战
在信息密集型机构中,许多部门和级别的人员都可以做出影响数据中心运营效率的决策。金融交易员可以选择运行复杂的蒙特卡洛(MonteCarlo)分析,而药物研究人员可以决定要将多少临床实验影像数据存储起来。负责应用程序开发的管理人员可以决定用多少编程工作来满足这些需要。服务器基础设施的管理人员可以做出设备采购决策。设施主管则可以决定数据中心的位置、电力供应,以及在预测的需求出现前安装设备的时间表。
上述决策通常是在孤立状态下做出的。销售经理可能会选择将交易由隔夜结算改为即时结算,金融分析师则可能希望为历史数据存储几份副本,他们完全没有考虑到这样做会对数据中心的成本造成什么影响。应用程序开发人员很少想到要对自身的工作进行优化,以将服务器用量降到最低,也很少考虑开发能够跨服务器共享的设计应用程序。购买服务器的管理人员可能会选择价格最低或他们最熟悉的产品。但是这些服务器也许会浪费数据中心的电力或空间。很多时候,管理人员会超额购买设备,以保证在最极端的使用情况下拥有足够的容量,而这会造成容量过剩。管理人员往往会建造有多余空间和高制冷容量的设施,以满足极端情况下的需求或应对紧急扩建。
这些决策在整个机构中累加起来,将对成本和环境造成重大影响。在许多情况下,公司可以在不降低自身数据管理能力的前提下,停用现有的部分服务器,并搁置购买新服务器的计划。这可以借助一些众所周知的技术来实现。比如虚拟化,这种技术实际上是通过寻找服务器的空闲部分来运行应用程序,以达到容量共享的目的。但是公司不一定会这样做,因为没有哪位高管能够承担“端对端”的责任。在机构内部,管理人员会以最符合自身利益的方式行事,这就造成大多数数据中心效率低下,每台服务器上常常只运行了一个软件应用程序。
我们分析了一家媒体公司的近500台服务器,其中利用率低于3%的占三分之一,而低于10%的则占三分之二。虽然有诸多用于跟踪使用情况的现成管理工具,但这家公司没有使用其中任何一种。从全球来看,我们估计服务器的日常利用率一般最高只有5%到10%而已,这造成了能源和资金的浪费。对此,数据中心管理人员一般会回答,配备这些服务器是为了在极端情况下提供容量,例如应付圣诞节前一天的购物潮。但一般来说,这一论断并不成立,因为数据显示:如果平均利用率极低,那么高峰时段的利用率也会很低。此外,数据设施的数量不断攀升,但所存放的服务器和相关设备有时仅占数据设施容量的一半,这说明有上亿美元的资本支出被浪费了。即使公司报告认为数据中心已经满载,但沿着数据中心的过道行走,经常会发现服务器机架上有很多空位,原先放在这些空位中的设备都已经淘汰。
之所以出现这种不一致的现象,部分原因在于预测数据中心需求的难度很高。运营的时间框架是一个问题。数据中心的设计和建造一般需要2年或更长时间,而预计的使用寿命至少为12年,因此容量是在业务部门产生实际需求之前就已经设定的。与此同时,对于业务决策如何互相影响,如何转化为对新应用程序的需求,以及需要多少服务器容量才能满足需求,还存在着认识不够全面的现象。例如,如果客户需求增长50%,许多公司很难预测出服务器和数据中心的容量是需要增加25%,还是增加100%。在极端情况下,我们发现一些设施在投入运营后常年处于半空状态;而另一些公司在建成一个数据中心之后,很快就发觉需要再建一个新的。
如今数据中心已经成为一项昂贵的资产,由此可以推断,财务绩效责任落实得十分糟糕。设施的财务和管理责任往往会落在不动产管理人员身上,而这些人基本不具备相关的专业技术知识,对于IT与核心业务问题的联系也缺乏深入的认识。同时,管理服务器运营的人员很少去了解关键运营支出的数据,例如耗电量或IT设备所占不动产的实际