存储网络工业委员会(SNIA)将可持续数据保护(CDP)定义为“一种可以不间断的捕捉数据变化轨迹,独立于已存储数据本身的存储仅有改动的数据,开启从之前任意点恢复,存储在一个独立位置并在真实恢复前无需被定义的一种方法论。”
需要特别注意到的是,在上述对可持续数据保护的定义中,并未出现有关“快照”的字眼。在当今的可持续数据保护软件中,厂商允许用户提前创建已知的恢复点,唯有这个时候,快照才被用到,而这并不是一定要求的。作为一个可持续数据保护软件,系统应该可以恢复到任意时间点,而不是仅仅是快照产生时。
可持续数据保护系统通常配有数据开关或者写入拆分。对主存储的写入操作通常会被“开关”或者“分离”成两条路径;每一个写操作会被发送到其原先的目标,同时也会被送入可持续数据保护系统。数据开关可能被视为被保护主机上的代理或者它可以被存放在存储网络上的某个地方。作为运行在主机上的代理,数据开关对主机系统几乎没有影响,因为所有的“重活”均是在其他地方完成的。那些将它们的数据开关安放在存储网络上的可持续数据保护产品正好可以这样使用存储系统,比如像博科公司的存储应用服务API、思科系统的MDS line以及其针对EMC公司Clariion存储产品内嵌的分离特性专用的SANTap 服务特性。一些可持续数据保护系统为那些安放了他们数据开关的地方提供了新的选择。EMC Clarrion产品内嵌了拆分功能。一些可持续数据保护系统也有让用户自己选择在哪里放置数据开关的位置。
作为用户来说,他们则需要定义一个可持续的卷组和主机名来定义恢复到时间点的操作。一些可持续数据保护系统还可以允许在卷组下建立组,这样就包含了多个可持续卷组,从而也增加了数据的安全性。有些用户可能会选择使用应用级别的数据快照,比如说将Oracle数据库放置在备份模块中或者在Windows系统上使用卷影像拷贝服务(VSS)。需要知道的是,快照并不是必须的。有一些可持续数据保护系统只能简单的将这些应用级别的快照给记录下来,还有一些则另外提供了创建快照的功能。这种方法对于那些需要维护应用级别快照的集中记录的可持续数据保护系统极为有帮助。
每一次的写操作请求都会被发送到第一个恢复设备上,这通常会是数据中心里面的另外一个设备或者是存储阵列。这样的一种被保护的数据上的关联性使得不管将数据写入同步复制或者异步复制的设备之间的时间差相当的小。即使一个持续数据保护系统支持同步复制功能,大多数用户都会选择使用异步复制来避免对生产环境的性能造成影响。一套可持续数据保护系统可能支持自适应的复制模式,比如说,当系统不忙的时候会同步复制而当系统繁忙的时候会恢复到默认的状态,采取异步数据复制的方式来避开系统繁忙期。
“即使一个持续数据保护系统支持同步复制功能,大多数用户都会选择使用异步复制来避免对生产环境的性能造成影响。”
数据会被存放在两个不同的地方:恢复卷和恢复日志里。恢复卷顾名思义是被保护数据卷的拷贝,通常会在恢复操作的时候被用来替代原始卷。而恢复日志则存放着所有的写入操作的日志,并且按照写入操作的顺序存放。恢复日志通常会被用来将恢复卷前滚或者回滚到恢复中的任意时间点。它同时也可能会被用作于写操作的临时高速缓存,这样之后再将缓存中的数据写入到恢复卷中去。这样的设计允许恢复卷和恢复日志成为相对价廉的存储,并且写入和恢复速度都不会比被保护的卷要差。
一旦数据被拷贝到第一恢复设备,之后就可以复制到远程站点上去了。由于WAN网络连接的自身属性特点,可持续数据恢复系统需要在有足够带宽。同时也需要满足当发生变化的时候能够临时“落后”或者“赶上”.有些系统上,用户可以自身定义一个可接受的延迟时间,通常几秒钟到甚至超过1小时都可以接受,这也最终反映在了复制系统的恢复目标点(RPO)上。可持续数据保护系统将所有的写操作作为一个大的批处理文件发送出去,如果其中的一个单独数据块被多次修改,用户可以用“写折叠(write folding)”进程设置仅发送最后一次修改。很明显的是,灾备站点的拷贝的可恢复颗粒度将不如现场的恢复系统,然而这同样也可以被理解为一种系统是可以支持这项功能的而另一种则不行。
现代可持续数据保护系统同样也自带了一个为那些长期存储应用内嵌选项。用户可以选择一个较短的时间段,比如是从中午12点到12点30秒,然后告诉可持续数据保护系统仅保留那些需要维护这段恢复时间点相关的数据块,而其期间的数据块均可以删除。那些做着应有级别快照的用户通常会全盘考虑然后决定留下哪些最重要的恢复点为业务可持续性考虑。在可持续数据保护系统上删除那些不相关的改变能够让系统本身有更多的容量为更长一段时间的使用。对于那些更长数据保留期限的需求,同样可以将这些恢复时间点备份到磁带上,然后再从磁盘上过期,删除。许多公司都会采用如下的三种方式:首先保留那些几天内改变的数据,其次是一周左右时间保留的每小时的恢复点,之后再是每天的恢复点数据,最后再将超过90天的数据存放到磁带上。
可持续数据保护和恢复
对可持续数据保护系统最大的好奇在于这样的系统是如何进行恢复操作的。一套可持续数据保护系统能够随时对LUN上的应用进行恢复或者测试,而无碍乎究竟测试的要求是进行回滚的操作或者还是需要到指定的恢复点。也就像前面所描述过的那样,大多数用户偏好于将恢复卷回滚到当时他们创建应用的可持续镜像上。虽然这对于用户来说,带来的可能是这段时间数据改变的丢失,然而用户考虑的是宁愿丢失这些数据而也不愿意让他们的恢复进程崩溃。
对可持续数据保护系统最大的好奇在于这样的系统是如何进行恢复操作的
根据产品的不同而有所不同,用于恢复的LUN可以是真实的恢复卷(回滚或者前滚),而虚拟卷的设计往往多数是以恢复测试为目的的,也可能是模拟恢复卷的回滚和前滚的操作,让应用感觉回滚或者前滚操作已经完成,而实际操作正在后台同步发生。有些系统可能同时让同一个恢复卷恢复到不同的回复时间点上。
一旦原始的生产系统被修复好,恢复进程就会立即撤销。恢复卷通过将数据复制回到起始的位置来被用作重建起初生产卷。而如果系统仅仅是遇到宕机,生产卷并不需要被替换,这种情况下,通常会仅仅通过发送宕机期间数据的改变来让系统更新到最近状态。当原始卷被更新到最新状态后,应用就可以被恢复到原始的位置在,之后就可以继续做对生产卷的备份了。
在对比传统基于可持续数据保护技术的恢复方案以及传统备份系统所需要的恢复进程后,你会更加清楚的了解到为什么在对数据备份和恢复中建议使用可持续数据保护方案。