长期以来,重复数据删除设备被谈及很多,而最近重复数据软件更让人影响深刻,其提供十分有用的性能,价格较相应的设备也更为经济。但是,根据用户和分析师的反馈,重复数据删除硬件设备对很多类型的企业来说仍然是很好的选择。
同时具备源和目标端的去重是趋势
基于软件的重复数据删除旨在消除源的冗余,而基于硬件的重复数据删除强调存储系统本身的数据削减。虽然基于硬件的重复数据删除无法提供带宽补偿,而在源中进行重复数据删除中有可能获得带宽补偿,但是基于硬件的重复数据删除的压缩级别通常会更高,并且基于硬件的重复数据删除产品需要的维护更少。
根据Forrester研究所的分析师Rachel Dines分析,一般情况下,对于那些大规模数据存储和高吞吐需求量的大公司来讲,重复数据删除硬件更具有吸引力。并且她解释说“重复数据删除的计算方法在软件和硬件上有着极其的相似之处。”另一方面,Dines认为重复数据删除硬件不单单只是在硬盘上运行软件,同时也为数据的重复删除提供了进一步的优化,并且它具有日常的自我管理优势,所以他们可以直接进行自我配置,更加令人满意的是大多数设备都具有不同的借口与备份软件交互。
Dines还解释到“这些功能是第一次运用在虚拟磁带库上,它们提供了磁带仿真,并且使得技术上的过渡更容易实现。现在,针对于类似Symantec Corp这样的开放存储应用借口的发展之下,重复数据删除硬件能够连接备份软件,并且提供更加精细的高级管理功能。”与此同时,Dines还指出,几乎所有存储领域的大型设备厂商,像是CommVault系统下的Simpana、EMC公司的NetWorker,IBM公司的Tivoli(TSM)存储器管理系统和Symantec的NetBackup,都在他们的软件中提供了源和目标端的重复数据删除功能。
尽管如此,Dines认为“通常意义下,源端的重复数据删除不可能很好的运行于数据库或任何的事务性系统下,因为这样会使得主机端的处理处于超负荷的状态,并且这种负荷值可高达25%。但是当这些应用类型在目标端进行重复数据删除时就不会产生以上提到的超负荷情况,无论是在重复数据删除的硬件上还是在软件上。”
现在,市场上有许多的软件备份产品都同时具有源和目标端的重复数据删除功能,越来越多的企业在向这个方向发展,尽管如此,像EMC公司的Data Domain这样的重复数据删除硬件是不会消失的,它们只会更加的往上游具有大环境的大公司方向发展,特别是具备PB级容量的。
重复数据删除硬件更有管理优势
杰克逊市的一所中学位于密歇根州,它可以算是一个中等规模的组织,按照他们的需求,他们预计使用重复数据删除硬件设备。学校的网络工程师Greg Wade说,在准备安装硬件设备之前他们正在用传统的备份系统备份SAN中的一个LUN,然后它只能将已经保存的9TB数据保留10天。
Wade继续说道,他们选择了一个4TB的设备。Wade说“在我们购买了这个设备之后立刻赶到全体解脱了,现在,我们将这个设备放在自己的离线数据中心。”
Wade说“由于在整个学区所位于的区域内具备光纤连接的条件,所以在传输速度上没有任何的问题。一年之后,他们又购入了另外一台设备,并且和之前的那一台进行了连接,这样两台设备就被连接为一体,在管理上更加的方便。现在,校区以7:1的一个压缩比已经备份了60TB容量的数据。”
Wade接着补充说道“在管理方面,他们现在基本上只是做好一些基本的功能设定,然后就可以不用管了。校区目前还在继续使用以前的备份系统,我们所要做的只是在新的硬件设备上创建共享存储时改变一下目标位置。”
“当然,在使用重复数据删除硬件之后给我们所带来的立竿见影的好处就是备份的速度大大提升了。在使用最新的硬件设备之前,我必须在每周五的下午五点开始进行备份,当下周一时你会发现他们仍在运行,一整个周末它们都没有停过。现在,我自己有了各种的空间选择,所有的备份会在周日前完成,这给了我大量的时间,因为所有的任务不会不断的在后端运行,所以减少了我们的备份窗口。”
重复数据删除软硬件要按需所求
GlassHouse技术公司的高级战略顾问James Brissenden认为,其实有很多种方法可以完成重复数据的删除,但他个人觉得对于用户而言,硬件设备的使用似乎效率更高,因为当拥有大量的数据需要存储时,硬件设备将特别的发挥其作用。
根据Brissenden的观点,他认为当你要判断是选择硬件还是软件时,首先要做的事情就是确定好你当前正在使用的是什么备份软件,以及你所需要的性能是什么。有可能你所使用的软件已经可以满足你对于性能的需求。数据复制又是另外一件你所需要考虑的事情,也许你可能想配置重复数据删除系统以使得数据俩心啊可以进行容载的恢复,但你要清楚,有些硬件平台可以提供数据的复制,但有些却不会。
Brissenden建议,对于目前竞争性的重复数据删除比率要保持高度的警惕性“目前吓人的战术比比皆是,而实际上,能够驱动比率的只是数据的属性而已。”
此外,Brissenden认为,支持Symantec OST的应用接口也是至关重要的,尤其是虚拟化时。“你希望能够创建副本,并且使应用程序和重复数据删除硬件可以意识到。”
最后,Dines说道,尤为重要的一点,所有重复数据删除基本来说都是软件,但在备份环境下有两种不同的实现方式:与硬件进行集成(即EMC Data Domain或IBM的ProtecTIER)或与软件打包(TSM,NetBackup,等)。重复数据删除磁盘库功能通常在5,000元和7000元的每个可用TB(在重复数据删除之前)。软件产品则通常附加在备份软件中,当然,他们不包括在进行hashing处理时所做的运算资源(如果是源端,将来自于主机,如果是目标端,将来自于媒体服务器),也没有实际的存储,因此在TB基础上是很难对两者进行比较的。