2011年8月18日上午9:00,由ITValue和商业价值杂志主办的2011“IT价值峰会”正式开幕。Emerson Network Power|Avocent (中国) 技术顾问罗霆做了题为《如何定位数据中心基础设施管理》的演讲。以下为演讲实录。
罗霆:今天很高兴有这样机会跟大家交流一下,我们公司的一些想法和经验,今天的主要内容是关于如何定位数据中心基础设施的管理。传统意义上的数据中心通常会和IT隔离出来,在云计算时代,我们会认为数据中心所有服务的东西都应该作为一个基础设施来看待,就像微软的集装箱,这里面已经拥有了IT技术的中心,在这个层面上就可以展开了,我们IT只能拿到我们的网络,我们的服务器。因此意味着我们把跟IT架构的环境和整个环境作为一个统一的对象来考虑,并且考虑到之间的相互管理,这点对我们传统意义上的数据中心是不太一样的。
在数据中心的生命周期角度来讲,从设计开始,会经过实施运营持续的勾画,我们会发现这是一个数据的管理,在设计阶段,我们可以看到作为基础设施来说,IT部门不是具体到服务器的一个数量,这个时候我们需要考虑的是运算的能力,就是数据中心到底能够支撑多少运算的能力,从能力这个层面上考虑的,因此数据中心的要有这样的能力,这个能力不能一估就10年,但是我们通常是10年、20年来预估的。整个IT预估的过程起码是1一3年。在设计完整以后,我们进行实施,实施其实是部署的一个过程,部署完成了以后,就接着是一个运营,运营过程要解决一个很大的问题,解决实际运行的情况及跟我们当初设计的情况是否吻合,如果不吻合我们就进行调整,包括做更大动作的调整整改,假设一下,如果现在的实际情况和预想的情况是一致的,在运营层面就不用做太多的工作,现在IT的情况越来越复杂,从IT来说,投入的成本大于我们当初预算的成本,最后一个阶段是优化阶段,我们不断的调整,需求在不断的变化,我们需要进行优化,优化的结果是下一个数据中心的模式的设计,这就变成一个循环。从数据中心的基础设施来讲,IT有五个物理需求,包括攻坚、制冷、空间、安防、布线。我们采购IT设备的标准也必须是统一的,如果这些标准主要反映到我们刚才提炼的五个物理需求上,所以在设计的阶段,我们要注意这五个方面,但是现在的数据中心来说,用户往往会考虑得很周到,更多的是考虑供电和制冷,因为这有一个计算能力的需求,所有的服务器用电90%的用电量会进行排放,所以制冷是一个很重要的因素。在管理的层面上有三个非常重要的地方,第一,保证IT的可控性,我们一般把IT分为三个层面,对底层的是基础设施,上去是IT,IT上去是业务应用,比如说IT层面像业务层面提供服务的,如果业务层面不可用的话,说明IT存在的必要性会受到一个挑战,因此,保证可用性是第一位的,再满足第一位的情况下,我们可以降低运营的成本。对于数据中心的运营来说,我们可以拆散为几个阶段,第一个阶段是部署,也就是支撑IT运营的过程,第二个是IT业务系统的上线,业务开始运作了,我们各种OA都可以运用,第三是对监控系统,发现问题后,我们可以采取相应的行动,确保业务系统的正常运作。第四,确保业务可用的情况下,我们可以用一些技术或者是云的技术新一代的技术实现绿色的优化,降低运行的成本。在数据中心,基础设施目前面临的挑战可以有五点。第一点是可用性,这也是我们存在必要性一个很重要的地方,后面两点是我们在云时代继续生存的要素,包括在生命周期内的可适应性和可扩展性。最后两点的可管理性和可维护性/服务型做到,这五点他们是相互依托的。
回到最初的设计阶段,看上去跟IT没有很大的关系,因为在我们公司的设计阶段,IT基本上是不存在的,只是一个概要的需求,当数据中心运行起来以后,我们可以通过这个图展示数据运行的情况,发现机位是不是过热,供电是不是足够的情况,因为我们设想跟实际情况是有差异的,所以我们要对这个数据进行管理。我们尽可能的缩小实际跟设计之间巨大的差距,当然缩小是不可能最小化的,不然的话,我们的业务就没有发展,到了差距没有办法缩小的时候,我们应该增加一个模块实现扩充,这也是数据中心模块化的定义,当前可以从两个方面缩小差异,一是构建支持硬的基础设施,包括通过可调整模块化的基础设施,比如说,模块化的UPS,模块化的供电,模块化的空调实现基础设施的设计,另外我们可以通过配电和容量管理系统帮助我们掌握基础设施的消化的趋势,我们可以通过了解未来IT的发展趋势,包括云计算这些新的技术,便于我们在数据中心采取更好的技术,使这个数据中心有更强的生命力。
第二块,通过优化基础设施的使用,做一些全面、细致和精准地了解,通过规划地使用基础设施,通过这些延长数据中心的使用,实时检测基础设施,排除异常的情况,从而使基础设施能够得到很好的使用。
假设我们现在是维护一个好的数据中心,其实非常重要的一点是在于挖掘,我们经常说我们的网络是不可管理的,目前大多数的基础设施是可以管的,我们面对新的数据中心的时候,或者是对数据中心进行调整的时候,第一步是对原有投资过的一些功能给挖掘出来,比如说以前的制冷的UPS,把可管理的功能挖掘出来了以后,可以整合到新的平台里面,这是非常重要的一步,这里面涉及到局限性,主要是在于数据的兼容性和管理的细化,可以这样讲,对于一个管理接口,管理的力度决定了可以管理的深度,因此在设计阶段,我们决定自己管理的深度和可管理的光度,在这个层面上决定我们需要购买哪些设备,如果我们投资很多的钱买一个功能丰富的设备,但是发现我们管理上是达不到这个水平的,实际上这也是一种浪费。在基础设施的管理方面,我们很少说管理这个词,大多的时候是使用监控这两个字,在中国的词汇里面,监控有两个方面的含义,检是代表检测、采集和收集大量的数据,控是做一些反馈,调整运行状态,怎么根据收集上来的运行数据决定策略对于大多数的用户来讲,绝大多数都放在检测上,对于监控是一个自化性的,或者是本能执行的手段。如果这是一个云的数据中心,我们就可能在依据手动的方式进行调整,而是根据收集上来的数据进行判断,再根据业务进行混合决定如何控。这个控的过程也是自动的,这样的话,响应的速度才能足够的快,才能满足云计算的要求,同时,这也意味着检测的时候,我们决定着设备采集的信息量的大小。在整个过程里面,我们需要消费我们收集上来的检测数据,加上我们本身对这个数据的知识库,最后形成了一个控制的结果,这也是管理里面最核心的地方。
DCIM已经出来有几年的历史了,他一是某一个概念,它是整个IT圈子的共识,也就是说,数据中心基础设施的管理核心是帮助IT形成一个业务决策,无论购买哪个厂家的解决方案,很多客户这样讲,花了很多的钱买了职能PPU,里面收集很多的能耗、供电的信息,但是这些数据有没有用,可以说,如果这些数据没有帮助我们形成一个决策,这些数据都是零,只是数据,只是信息,除非我们依据这些数据把它做成业务调整和一个块的策略,把这些策略付诸实施,才能形成一个循环起来的价值链。我们既使购买了大量的智能设备,没有相应的操作起来也是没有意义的。
回到前面说的数据,数据是非常重要的,很多用户说,我有决策,但是如果这是决策没有来源于数据的话,决策是等于零的,所以从前端到后端,这两端是不可缺少的,所以DCIM来说,数据是一个基础。在基础架构管理这块的数据来源于哪,我们总结有来源于三大类,一是技能的基础设施,第二大类是IT设备,我们现在可以看自己的服务器,基本上90%服务器都有一个内设的芯片,这个芯片是可以独立的运作的。第三类是我们的传感器,包括温度、风量不同的传感器,我们把所有的数据收集上来。有了这些数据以后,我们需要做一个统一的数据格式,很多时候我们都觉得数据在那里就行了,格式并不是很重要的,但是如果我们对这个数据进行格式的时候,如果没有一个统一的格式就很难处理。数据的格式必须统一起来,否则每个数据集中在自己管理的范畴,当我们对数据中心运营时,我们会采集到多方面的数据,比如说来自传感器的数据,包括空调配电的数据,我们把这些数据关联起来,否则的话,并没有办法做到统一的管理。这样就影响到服务器的正常工作,这样会直接影响到服务器的机箱的温度,如果没有统一的格式,我们没有办法把这些数据做一个统一的管理,所以统一数据是非常重要的。
在管理过程中,我们也可以参考很多的经验,其中非常重要的一条,有很多种管理的流程可以通过我们的管理平台交织在一起帮助我们解决很多的问题,比如说配置管理,这是管理的基础,因为提供的是梦想信息平台,或者说安全管理也是始终贯穿在所有的流程里面。安全管理不是一个单一的流程,包括各种各样的流程都渗透了安全管理的元素,其实在这里有一个概念,我们在DCIM投入的工作量很大,我们需要各种各样的投入,他们之间是相互交织在一起的。另外一个问题,很多购买了DCIM的企业希望把实际和设计联合在一起,所以,每个用户有自己的架构和管理的流程,当用户挑选一个解决方案的时候必须了解这一点。
这是一张投资回报图,里面讲到DCIM有很多管理雅俗,这意味着我们要到一种平衡,我们必须在安全配置、问题、变更上达到平衡,才能发挥各自价值的优势,比如说,我们有一个很大的配置管理系统,面面俱到,任何东西都考虑到,但是没有人用它,它的价值就是零,因为配置管理本身是解决不到任何问题,投入也需要达到一种平衡,这样才有效果。
我们公司是为大家做设计的业务部门,能够提供设计中心的一个解决方案,因此有能力为一个数据中心的模型建立解决方案,能够提供一系列管理解决方案,帮助用户,用户建立从设计到实施到运营到将来的优化形成完整解决方案的公司。刚才我们提到数据采集的形成,包括我们提到很多的流程的管理,包括配置、变更容量等,这些都是埃莫森目前能够在数据中心帮助用户提供一站式解决方案的服务。
谢谢大家!
个人介绍:
罗霆先生现任Avocent(中国)技术顾问,主要负责Avocent在华南/西南的技术服务和支持工作。是Avocent中国区技术中坚力量。罗霆先生加入Avocent之前,曾服务于戴尔、惠普等著名IT厂商,负责数据中心的核心解决方案的技术支持工作。罗霆先生具备近十五年IT从业经验,具备丰富的IT技术集成和支持的经验。近年来一直从事数据中心架构与管理的售前技术工作,致力帮助用户提供高效、可靠和安全的整体解决方案。
演讲介绍:
由于不同客户的DCIM管理实践的发展历程不同,在DCIM各子领域的投入权重会有很大不同。实时监控、访问控制、配置管理、运行管理、变更管理、容量管理、问题管理、性能优化。在同一子领域中,不同客户的管理实践也会导致其需求复杂度的不同。服务的要旨在于让DCIM管理应用能够与客户的DCIM管理实践结合起来。