自动存储分层(ATS)是去年存储阵列业界讨论得最多的话题之一。
它指的是存储阵列在不同的磁盘格式和RAID水平之间迁移大量数据的能力,目的是为了实现性能和空间使用之间的均衡,避免所谓的热点。
该领域的领先厂商是Compellent(现已被戴尔收购),它从2004年开始提供这种功能,但现在所有顶级厂商如EMC、HDS、惠普3PAR、IBM 和NetApp都在各自的产品中提供了类似的功能,只是各厂商对它的称呼不同,使用的方式也不尽相同,因为各厂商的产品基础架构千差万别,对存储中虚拟层的看法也不太相同。 因此,本文不打算讨论哪一家厂商的产品是最优的,而是打算对不同的ATS应用方案中用户需要评估的所有重要指标进行一次全方位的评估。
LUN或sub-LUN
早期,有些厂商曾经试着推出过一种将LUN从快速磁盘移动到廉价但容量更大的SATA磁盘的半自动功能。这种解决方案非常简单,但无法应用于现实,因为涉及到大量的数据移动,而且缺乏粒度。
现在在sub-LUN中使用ATS的方案比以前要更加巧妙,LUN会被分为很多个数据块,每一个数据块则可以被存储到不同的存储层,有时为了保护数据甚至还可以存储到不同的RAID层。
引擎和算法
每一家厂商都开发了自己的移动引擎,根据时间/事件和/或访问频率将不同的数据块移动到不同的存储层。每一种移动引擎都取决于整体架构,但总的来说分为两种:“所有数据都在阵列中”或“部分数据在阵列外”。
在“所有数据都在阵列中”架构中,所有的监控功能都在控制器及其软件之中,所有的功能都与软件/操作系统无关,但是当某一部分数据移动发生在阵列之外时,数据移动就存在风险了,因为环境变得更加复杂,难于管理且容易受到外部因素的影响。
粒度
粒度指的是效率,效率通常意味着更好地节约成本。你可以发现不同粒度级之间的成本效率是截然不同的。 因此,粒度很重要。因为:
粒度越小,后台移动的数据就越少;
粒度越小,数据移动的频率就相对越高,更有利于数据调整和细微调节;
大数据块的风险在于:
在移动大量数据前,算法需要等候很长的时间,这样就会造成数据移动时间的推迟。
如果有少量活跃数据存在,比如在一个很大的LUN中存在几个MB的活跃数据,那么就可能要把几个GB的数据移动到成本较高的高存储层。
你需要多少个存储层?
通常,你会发现粒度越小,能够支持的存储层就越多。最全面的解决方案能够支持固态硬盘、FC/SAS和SATA不同RAID层和数据优化方案中的每一个LUN.其他有些厂商提出了一种更为简单的双路分级法,虽然效率可能不太高,但在某些应用环境下却表现得不错。
降级还是提升?
另一个评估要点是阵列对写入操作的初步数据处理。实际上,当ATS应用的粒度更细时,你会发现数据被写入了速度最快的存储层,然后再降到速度较慢的存储层,整个应用过程以性能优先。 但有些解决方案会先将数据写入速度最慢的存储层,然后再根据具体情况将数据提升到较高的存储层。
第一种解决方案以性能优先,第二种解决方案以成本优先。
正确使用固态硬盘
固态硬盘是解决性能问题的一种非常有用的技术,但它的成本很高。 如果使用自动分级方案,那么你只需购买满足访问频率最高的数据块所需数量的固态硬盘即可。一款优秀的配置,通常都是多层系统配合自动分级技术,整个设计类似于金字塔(固态硬盘在最顶层,FC/SAS在中间,SATA在最底层)。
易用性和风险
ATS的使用很简单,通常你只要通过一个图形用户界面给LUN进行定义和建档就行了,系统会自动将数据写入相应的存储层。
风险是ATS过于简单,如果你建立了一个错误的档案或整个阵列未能正确配置,那么你就可能得到意外的、难以诊断的不良后果。