在数据信息日益重要的今天,构建完善的数据保护系统成为研究的热点。 持续数据保护(CDP)技术是对传统数据备份技术的革命性的重大突破。传统的数据备份解决方案专注在对数据的周期性备份上,因此一直伴随有备份窗口、数据一致性以及对生产系统的影响等问题。现在,CDP为用户提供了新的数据保护手段,系统管理者无须关注数据的备份过程(因为CDP系统会不断监测关键数据的变化,从而不断地自动实现数据的保护),而是仅仅当灾难发生后,简单地选择需要恢复到的时间点即可实现数据的快速恢复。
CDP技术通过在操作系统层中植入文件过滤驱动程序,来实时捕获所有文件访问操作。对于需要CDP连续备份保护的文件,当CDP管理模块经由文件过滤驱动拦截到其改写操作时,则预先将文件数据变化部分连同当前的系统时间戳(System Time Stamp)一起自动备份到UnaCDP存储体。从理论上说,任何的文件数据变化都会被自动记录,因而称之为持续数据保护。
网络存储工业协会(SNIA)数据保护论坛(DMF)的持续数据保护特别兴趣小组(CDP SIG)对持续数据保护的定义是:持续数据保护是一套方法,它可以捕获或跟踪数据的变化,并将其在生产数据之外独立存放,以确保数据可以恢复到过去的任意时间点。持续数据保护系统可以基于块、文件或应用实现,可以为恢复对象提供足够细的恢复粒度,实现几乎无限多的恢复时间点[4]。
持续数据保护技术的关键词是“持续”,其主要功能是在故障瞬发生的瞬间完成对数据的快速恢复,保证业务的连续性。就给定的数据集而言,持续数据保护提供连续的恢复点,能够存取任何时间点上的数据,允许应用恢复到任意的时间点之前,而不仅仅针对那些由备份流程预先确定的特殊时刻,且恢复点可在事件发生后选定并动态重建。因此持续数据保护能够提供无限密集的恢复点,有些情况下可以提供接近即时的恢复。
持续数据保护并不是一项全新的数据保护技术,它是建立在传统数据保护、容灾技术基础之上的一套方法。和传统的数据备份和恢复技术相比,持续数据保护在几个方面有明显的特点[6]:
保护连续性
更小的恢复点目标(RPO)
更小的恢复时间目标(RPO)
传统的数据保护解决方案专注于数据的周期性备份,因此无法避免存在备份窗口、难以确保数据一致性以及会影响生产系统等问题。图1所示为CDP与传统数据保护在保护时间间隔上的比较。而持续数据保护是一种精细化多点跟踪技术,会不断监测关键数据的变化,捕获和保护数据中所有的变化,而非仅仅是某个预先选定的时间点,能将数据风险丢失量降低到几秒。

1 持续数据保护技术的实现
1.1 持续数据保护关键技术
持续数据保护实现的关键技术是对数据变化的记录和保存,以便实现任意时间点的快速恢复。一般来讲,有3种实现方式。
(1)基准参考数据模式
基准参考数据模式如图2所示。基准参考数据模式是一种After Imaging的策略,对要保护的数据建立一个初始的映像,然后将其日志按数据请求到来的顺序记录。这种策略中每次数据请求多只导致对磁盘的实际写操作,因此实现简单,带来的额外开销较小。基准参考数据模式在数据恢复时,需要从原始的参考数据开始,逐步进行数据恢复,恢复点越靠近当前点,恢复所需要的时间就越长。

(2)复制参考数据模式
复制参考数据模式如图3所示。复制参考数据模式是一种Before Imaging的策略,它维护的映像是数据的状态,因此它克服了基准参考数据模式中数据读效率低的缺点,适合于读请求较多的环境。复制参考数据模式通常利用Copy on Write技术,即映像中的原始数据被覆写之前先将其拷贝到日志中。这样记录的日志在恢复点越靠近当前点时所需时间越短,但写操作能引发两次写操作,因此,需要较多的系统资源。

(3)合成参考数据模式
合成参考数据模式如图4所示。合成参考数据模式是以上两种模式的折衷,较好地实现了以上两种模式的妥协,因此可以得到较好的资源占用和恢复时间效果。但需要复杂的软件管理和数据处理功能,实现起来比较复杂。

1.2 持续数据保护实现层次
CDP技术或解决方案可以在不同的层次实现,参考SNIA的存储共享模型,可以将当前实现CDP的产品或解决方案分为3类:
基于应用的持续数据保护
基于文件的数据保护
(1)数据块级持续数据保护技术
数据块级的持续数据保护技术可以直接在物理的存储设备上运行,也可以在数据块传输层上运行。当发生数据块写入操作时,持续数据保护功能模块可以将原始的数据复制并传送到另外一个存储设备中进行存储。数据块级的持续数据保护需要将所有更改过的数据块按时间顺序保存下来[7]。每次写操作都会生成带有时间标记的数据块副本。由于每次数据写操作都被完整的记录保存下来,因此数据块级的持续数据保护技术能够动态地访问历史任意一个时间点的数据。数据块级的持续数据保护技术的优点是与应用的相关性比较小(因为运作在块设备层,与文件系统、应用无关),性能以及效率都比较高(特别是对于数据库这类直接访问块设备的应用)。其缺点是对备份存储空间的要求比较高,同时对于数据一致性的处理也缺乏通用有效的机制。数据块级持续数据保护技术又有基于主机、基于传输层和基于存储层3类实现方式。
(a)基于主机端卷管理软件或客户端代理软件Agent实现
目前常见的主机端卷管理软件有VeritasVxVM、LinuxLVM、Microsoft动态磁盘等,也有厂商针对Linux和Windows平台开发了客户端代理软件Agent。它们的功能是通过卷镜像的方式获取生产数据的动态副本,并以此副本为基准进行数据持续保护。Symantec Storage Foundation、Falcon StorCDP、浪潮CDP属于此类。
(b)基于传输层实现
该方式通过含有DataSplitter功能的FCSAN交换机来获取同写入生产卷相同的I/O数据块,FCSAN交换机有BrocadeAP-7420B、CISCOMDS9000配置SANTAPSSM模块等,价格比较高。EMCRecoverpoint、LSIStoragAge等属于这种方式。
(c)基于存储层实现
某些厂商的存储阵列本身支持WriteSplitter功能,比如EMCClariiON磁盘阵列,这种实现方式比较受限于厂商。
(2)文件级持续数据保护技术
文件级的持续数据保护技术工作在文件系统之上。它可以跟踪文件系统中文件数据或者元数据的改变,及时备份这些变动信息并记录发生改变的时间,以便将来能够实现文件历史任意时间点的恢复。
目前根据持续数据保护思想在文件系统级进行相关研究的公司不多,主要包括:Symantec的Continuous Protection Server[8]、XOsoft的XOsoft Engine[9]、IBM的Tivoli Continuous Data Protection for Files[10]、Storactive公司的LiveBackup for Desktop/Laptops、TimeSpring公司的TimeData等产品。
(3)应用级持续数据保护技术
实现应用级持续数据保护技术时,需要在受保护的应用程序中直接插入和运行持续数据保护功能程序代码。在应用程序中实现持续数据保护的优势是与能和应用程序无缝整合,确保应用程序的数据在持续保护过程中的一致性,同时管理也比较灵活,用户容易部署和实施。目前在应用程序级实现的连续数据保护解决方案大多是针对成熟的应用开发的。已经有一些公司的持续数据保护软件可以支持微软公司的Office、Exchange,IBM公司的DBZ,以及Oracle公司的数据库等。
对于以上3种类别的持续数据保护技术,数据块级和文件级的持续数据保护技术是一种通用方法,可以支持多种不同应用。而应用级的持续数据保护技术则只为某种特定应用提供连续数据保护能力,其通常的表现形式是与应用程序的一种更为深入的集成。
2 持续数据保护技术的应用
对于持续数据保护的应用范围,目前大体可以归纳为3类:
(1)为数据中心内的文件服务器/网络附属存储提供普通的数据保护
在这种应用中,持续数据保护逐渐取代了以前那种夜间的磁盘或磁带备份任务。虽然,有些人认为持续数据保护只是为那些关键的数据而准备的,但是我们发现有些持续数据保护产品要比那些传统的备份方法更加易于使用,并且效果也更好。因此完全可以用于普通的文件服务器的备份。
(2)为远程的分支机构进行集中化的备份
将持续数据保护用于远程分支机构备份应用的好处就是避免了远距离转移磁带介质的风险。我们使用同总部一样的复制技术将分支机构的备份数据同步传输回来;同时集中化的控制也可以让异地之间的数据安全管理工作变得更加主动、高效。
(3)帮助实现笔记本电脑上的数据备份
也许人们曾经使用过很多方法来保护笔记本电脑上的数据,但都收效甚微。不过,从技术定义上讲,这并不能称为持续数据保护。因为这类产品只有在笔记本电脑与网络连接的时候,才能上传改变的数据。不过,像IBM Tivoli CDP这样的产品,即使在没有连接网络的情况下,依然可以很好地对数据进行保护。
一点要说的是CDP并不是对所有企业都很适合。CDP技术本身并不难使用,但却非常昂贵。CDP采用基本的数据保护技术,因此CDP适用于那些对数据备份窗口以及RPO忽略的公司,那些处理非常繁忙的网络事务的公司也非常适合。而不做这些事务的企业则可以找到更加适合于它们的磁盘备份技术,比如虚拟磁带库(VTL)以及快照技术。
3 结束语
在实际应用中真CDP技术应用较少,一方面是技术原因,需要解决数据的持续不间断监控和记录的技术难题;另一方面是由于真CDP技术持续备份时产生的大量数据,远大于其他备份方式产生的数据量,对数据存储形成巨大压力,也给用户造成费用负担,所以大多数CDP备份产品都采用准CDP技术。
准CDP技术目前在市场宣传中已经突破了原有的限定,被广泛用于代指可以按照一定的周期持续性保护数据的技术,如Symentac、EMC、飞康、爱数等公司采用的大多是快照技术,但也归入了准CDP技术行列。
采用真CDP技术的国内灾备企业大多是后起之秀,如壹进制公司的UnaCDP系列灾备产品,就是采用真CDP技术,并且采用差量备份和增量备份相结合的策略,大大降低存储量。并配合独立研发的重复数据删除技术,优化存储空间,彻底解决真CDP技术的应用难题。
我们相信随着持续数据保护技术的应用范围的扩大和人们认知的深入,会有越来越多的真持续数据保护解决方案和产品出现。在实现持续数据保护的需求上,用户将会有更多的选择。持续数据保护技术也将会作为在线数据的重要保护手段而独立开辟一条通道,成为一种新的贴近用户目标的数据保护方式。
免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。