正如其名,数据中心基础设施管理(DCIM)工具可以助力公司组织规划基础设施并简化数据中心管理。可是,当你询问不同对象什么才是数据中心“基础设施”时,将得到不同的答案。这对当前提供DCIM的厂商们来说也一样。
DCIM工具与它们在数据中心管理中所扮演的角色
某种程度上讲,DCIM产品是由传统建筑管理系统(BMS)基础上改良而来。这些工具被设计为提供整体设施中能源使用情况的相关信息,以便设施管理团队更好管理能源供应与冷却系统。一些DCIM工具采集基本能耗信息,或通过UPS的输出收集“IT总功耗”,与“设施总功耗”对比,获得能源利用率(PUE)结果。这些基线信息可以用于改进数据中心站点能源与冷却效率,同样可以优化数据中心管理。 还有的DCIM产品将目标锁定为帮助IT管理员监控机架级能耗与环境。DCIM工具提供商还将IT资产管理功能与能源利用监控进行了混合。许多DCIM产商同样提供“仪表板”,用于展示独立机架、服务器或其他IT设备的功耗数据。DCIM工具甚至可以提供关于每个机架与机架上独立IT设备的图形化地图,同时还包括了其能源利用率,温度及湿度。当然了,没有PUE指标计算器的DCIM工具是不完整的。因此,即使是面向IT的产品,也会需要有监控设施能源利用率的功能。
目前,几乎没有DCIM工具被用于直接控制IT设备与运行。它们同样无法进行自动扩展与直接控制设施功耗与其他设备,如用于大规模计算负载的冷却设施。大部分DCIM工具被设计用于提供更好的展示和分析不同系统的能源利用率。当然,用户需要先购买和安装相关所需的能耗测量设备。
利用DCIM工具进行能耗监控
购买能耗测量设备是诸多项目中的绊脚石。需要支付额外的电气设备安装费用,并进行相关带电作业,而且通常情况下,需要在所有系统都关闭以后才可进行。然而在运行关键任务的数据中心里,是不存在“关机”这个词的。
为了让DCIM系统可以采集与分析能耗信息,监控硬件需要与设施相关的设备,如水冷机组、CRAC,泵等一样,安装在切换器,配电板等处。在这些点位安装十分必要,将有利于对冷却设施进行深度分析。
在IT方面,DCIM系统可能会被用于收集UPS输出数据(用于高级视图),也可能用于提供机柜或IT设备级别更加详细的监控信息。测量IT设备能耗的最常用方法是安装智能PDU(iPDU)。我们将在之后的章节中详细讨论关于数据中心能源监控最佳实践。
一些厂商的DCIM软件可以从其他厂家设备接收数据,如UPS等专用设备。有些厂商同时提供硬件传感器与软件。某些厂商提供DCIM主机服务——传感器信息通过internet将信息发送至主机系统上,用户则通过浏览器接口进行查看。DCIM软件同样可以安装在本地服务器上。
一些DCIM平台提供资产与能源管理的综合功能。当然,在某些情况下,这些平台仅仅是个报告工具,无法对任何基础设施或IT系统设备进行控制。
DCIM的挑战与局限
DCIM厂商面对的主要障碍在于让工具既适合设施管理小组,也要满足IT部门的需求。满足双方不同需求十分困难,而且安装能源测量设备涉及到技术与后勤问题,需要有专门人员进行操作。不仅如此,这些数据中心管理队伍需要能够克服因安装任何DCIM客户端软件而给IT设施带来的潜在稳定性与安全风险。
一些仅提供软件的产商们正联合力量并与能源监控硬件传感器制造商们合作,以提供完整解决方案。但是每项实施都不尽相同,IT与后勤之间的合作是完成监控硬件安装的重要成功因素。利用现有建筑管理系统探索与获取信息,同样会对部署DCIM工具有所帮助。
就如之前提到的,每个小组或部门对DCIM的期待与其应具备功能都不尽相同。后勤设施小组希望DCIM可以关注能耗与冷却设施。而IT部门希望DCIM 可以实现机柜与IT设备级别的监控。理想情况下,DCIM还应该关注IT流程与计算负载,应用程序与虚拟化软件以及底层计算机硬件以提高数据中心管理。
最后,大部分DCIM工具应该是完全动态的,可以接收并根据实时计算负载情况提高(或降低)能源供应与冷却系统已满足负载需求。现在,DCIM的发展才刚刚开始,对于系统控制方面的功能正以缓慢的速度逐渐被人们接受。
另外一个问题是,谁将拥有高于系统管理与运维的最高控制权及责任。IT部门并不希望集中管理控制台变得像一个基础设施管理系统,那样可能会影响IT系统能够架构运维与稳定性。而后勤部门则不希望IT部门用服务器管理软件控制他们的制冷设备。