在最近一次客户会议中,我注意到数据中心设计项目里的一个不幸趋势。设备密度增加激化了数据中心复杂度,用户现在需要面对数百万美元的额外预算来实现N+1的基础设施设计目标(在承载业务的基础上,再增加一个用于冗余容错)。
很显然,设计建造以及运营高密度、高效率数据中心设施的挑战不会因设施的设计和工程而结束。它还需要一个组织良好的治理结构,由专业的,经验丰富并正直的团队进行监管。伴随着百万美元的投入,我们已经看到短板变成了丑陋而昂贵的错误。
专业知识的重要性
在最近的用户案例中,IT团队试图竭尽所能来建设基础设施,但还是遇到了大问题。(说明,为了保障公司匿名,我需要对具体情况做一些修改;为了讨论方便,让我们假设这是一家生物技术公司)。从本质上说,该公司正在建设一个新的数据中心,并且让设施建设团队主导数据中心的设计与建造过程。该团队一直与某家有着丰富洁净室建造硬件的工程公司合作。洁净室与数据中心非常相似,这会有多难呢?出于善意考虑,工程团队最终递交了一份N+1架构的高冗余设计。不幸的是,那是个有多处单点故障的设施。没有相关数据中心经验,工程师将事情弄得一团糟,并规划建设了拥有122兆瓦功率备用发电机组的设施,而实际上7兆瓦就足够了。心疼:这是价值500万美元的错误。更糟的还在后面,制冷设施能力不足,无法满足N+1级别下8兆瓦IT负载的冷却。你将得到这样的景象:项目需要高度专业的数据中心设计知识来避免重大问题,现在同样的专业知识被用来解决什么因该在第一时间完成。
不公平的治理,有偏见的供应商和顾问打成一片,以及经验不足的团队造成了痛苦与昂贵的后果。IT管理人员不断努力来使IT成为业务组织的一个重要因素。但在存有缺陷的数据中心基础设施上超支,意味着给自己挖了一个很深的坑,往往十分难爬出来。
那么,有什么解决办法吗?没有灵丹妙药,但找到具有相关经验又值得信赖的顾问是一个良好的开始。开发治理模型,让组织有效输入进而有效产出。除了规模非常巨大,复杂性极高的组织,任何IT组织都无法回答所有问题。IT领导者需要知道自己擅长什么以及在IT团队无法回答问题时,该去哪里寻求帮助。最重要的事,他们需要不断发现并提出自己无法解答的尖锐问题。