混合云存储模型
虽然私有云存储的出现化解了用户对公有云应用性能和安全性方面的担忧,但是对于非结构化数据应用来说,私有云的必要性不大。首先,私有云存储系统在设计上并没有利用已有的存储设施。事实上,构建它有一定的前提,需要数据中心的场地、电力、机架空间以及冷却系统。私有云存储运行在专用的硬件平台之上,因此也不可能扩展到像公有云存储那么大的规模。大多数的非结构化数据是静态不变的,很少使用,因此没有必要在数据中心本地部署前置设备或私有云。
因为这个原因,混合云存储应运而生。混合云的形式一般以传统存储系统或私有云存储为主,公有云存储作为补充。然而,一个理想的混合云存储平台必须满足几个关键的条件:首先,混合云存储的整体表现必须均衡,除了会产生一点网络延迟之外,访问公有云上的数据应该是无缝透明的。此外,数据迁移的机制必须保证活动的和经常访问的数据能够快速被访问,而静态数据则被推向云存储。因此,混合云一定要有智能的引擎,用来定义数据的移动策略,即何时推向云,以及何时从云端迁移回来。
实施混合云存储,主要通过三个途径:
利用云存储软件,将本地存储和公有云存储整合在一起
使用云存储网关设备
通过应用程序集成
基于软件的混合云存储架构
目前,在不使用网关设备,用户也不能自己动手集成的情况下实现混合云存储只有一种可能,就是通过在私有云和公有云存储上运行一套软件,将两个存储系统结合在一起,构成一个单一的非对称存储云。相关技术的标准化工作正在积极地制定过程中,比如SNIA(Storage Networking Industry Association)定义的CDMI(Cloud Data Management Interface)。如果缺乏统一的技术标准,集成这种非对称的云存储是无法实现的。因此,我们看到,云软件厂商把他们的产品销售给硬件制造商以及服务运营商的产业模式是创造混合云的必要前提。同时,还有些云存储厂商把他们的硬件堆叠打包并以私有云存储的名义推向市场,这种产品一般可以跟他们的公有云存储服务方便地进行集成。
后一种类型的典型代表是Nirvanix。直到不久之前,Nirvanix还只能提供纯粹的公有云存储服务,但在该公司发布hNode私有云存储产品之后,用户现在既可以在企业内部使用Nirvanix的云存储系统,又可以根据需要补充Nirvanix Storage Delivery Network公有云存储。
Rackspace公司此前提供基于云文件系统(Cloud Files)的公有云存储服务,现在,它把自己的Cloud Files转为开源项目,并创建了OpenStack.org以推进该项目的标准化进程。Rackspace试图建立用户端到服务运营商之间的混合云架构,就像他们之前提供的公有云存储服务一样。
以前,构建一套云存储服务平台只有两种选择:要么自己开发解决方案;要么使用开源的云存储软件,比如Luster或MogileFS,但使用开源产品的同时也必须接受它的特性和局限性。最近1、2年,商业化的云存储软件越来越多,相关厂商也都把企业级用户和运营服务商作为目标客户。
在目前可用的商业化产品之中,EMC的Atmos是最突出的一个。Atmos是一个以软件为核心,支持硬件跨平台,基于对象的堆叠存储系统。它的结构包括三层松散耦合的服务进程:表示层提供客户端接口,包括REST、SOAP和传统的文件系统协议;元数据管理层决定数据对象保存在哪个存储节点,以及数据冗余保护和分布的策略;最下面的存储层是存储节点的接口。Atmos可以运行在专用的硬件或VMware虚拟机之上。作为一个使用scale-out横向扩展架构的系统,通过简单的增加存储节点,最大可以扩展到PB级的存储规模。EMC通常向企业级用户和运营服务商推销Atmos,在客户端部署的前置系统能够同Atmos云服务相互绑定。
EMC最大的客户是AT&T。AT&T的Synaptic Storage是虚拟的私有云。然而,作为混合云存储,它的模式与其他公司的产品差别很大。Synaptic Storage运行在AT&T自己的数据中心内,客户却可以通过AT&T的MPLS网络访问该系统。通过这种方式,AT&T将私有云的安全性和高性能与公有云的经济性和扩展性很好的结合在一起。
除了EMC的Atmos,还有几种云存储软件产品值得我们介绍。Caringo公司的CAStor Content Storage Software软件是一个定位于CAS(content addressable storage)内容寻址应用的云存储产品解决方案。Cleversafe公司的云存储平台则利用IDA(information dispersal algorithms)算法将数据切片,并分散保存在云存储平台的多个节点上,这样可以降低数据复本的需求。Cleversafe宣称与那些为了保证冗余度而必须在存储节点上保存多份数据拷贝的产品相比,他能做到更高的存储资源利用率。
混合云存储网关
云存储网关位于企业内部的存储系统与公有云存储之间。它的主要功能是将传统的存储协议转换成专用的云存储协议和API。以前,公有云存储只有在和应用定制集成之后才能被访问。现在,通过云存储网关,企业内部存储上的数据就可以迁移到公有云存储上,反向亦然,这通常取决于策略引擎的设置。
各厂商提供的云存储网关之间的差别主要体现在几个方面,首先要看产品是基于block协议还是基于文件协议,这决定了它们在企业数据中心的角色,是块存储设备还是NAS装置。数据去重和压缩功能是云存储网关的关键特性,因为这两种功能对云存储的使用成本影响非常大,而且传输过程中和云存储端的数据加密是非常必要的。有些网关对备份和归档应用做了特殊的设计和优化,有些则与Microsoft Exchange和SharePoint之类的应用紧密集成,还有的产品被设计成交易处理型的存储结构中的一层,作为企业内部存储的补充。
与应用集成的混合云存储
所有的公有云存储服务都提供API,以便私有云存储软件和云存储网关与其进行互联。但这些API也可以直接被应用程序调用,实现应用程序与公有云存储的集成。云存储API能够帮助企业内部应用或商业应用系统通过REST接口充分利用公有云存储的资源。
举个例子,备份软件厂商已经开始在他们的备份产品套件中提供对公有云的支持。比如Symantec的NetBackup和Backup Exec,以及CommVault的Simpana备份软件都可以同公有云存储集成。
企业级客户的态度——乐于接受云存储
过去,企业级用户在很大程度上是远离云存储应用的。不过,随着私有云存储的出现,以及企业内部存储应用逐步附加了安全集成公有/混合云存储的功能,企业安全地将现有存储应用扩展到云存储之上已经变得越来越现实。
最近云存储被热炒,不过主要是在消费、移动应用领域,以及像Google、Dropbox之类的公共云服务。根据Gartner的估计,即使再过5年,主流的企业级用户也不可能完全采用云存储。但在此期间,企业级用户很可能策略性地增加一些混合云存储作为他们现有存储设施的补充。