CDP(Continuous Data Protection,持续数据保护)技术

CDP(Continuous Data Protection,持续数据保护)技术是对传统数据备份技术的一次革命性的重大突破。传统的数据备份解决方案专注在对数据的周期性备份上,因此一直伴随有备份窗口、数据一致性以及对生产系统的影响等问题。现在,CDP为用户提供了新的数据保护手段,系统管理者无须关注数据的备份过程(因为CDP系统会不断监测关键数据的变化,从而不断地自动实现数据的保护),而是仅仅当灾难发生后,简单地选择需要恢复到的时间点即可实现数据的快速恢复。      
        该项技术通过在操作系统核心层中植入文件过滤驱动程序,来实时捕获所有文件访问操作。对于需要CDP连续备份保护的文件,当CDP管理模块经由文件过滤驱动拦截到其改写操作时,则预先将文件数据变化部分连同当前的系统时间戳(System Time Stamp)一起自动备份到UnaCDP存储体。从理论上说,任何一次的文件数据变化都会被自动记录,因而称之为持续数据保护。          
        CDP技术分为真CDP(True CDP)和准CDP(Near CDP)两类。        
        CDP的分类是相对于数据保护时间点而言的。准CDP技术是按照一定的时间频率,持续的记录并备份数据变化,每次备份有一定时间窗口,需要数据恢复时,可以恢复到过去备份的时间点,并不能形成完全意义上的持续保护,因此称为准CDP技术。而真CDP技术是持续不间断的监控并备份数据变化,可以恢复到过去任意时间点,是真正的实时备份。      
        在实际应用中真CDP技术应用较少,一方面是技术原因,需要解决数据的持续不间断监控和记录的技术难题;另一方面是由于真CDP技术持续备份时产生的大量数据,远大于其他备份方式产生的数据量,对数据存储形成巨大压力,也给用户造成费用负担,所以大多数CDP备份产品都采用准CDP技术。      
        准CDP技术目前在市场宣传中已经突破了原有的限定,被广泛用于代指可以按照一定的周期持续性保护数据的技术,如Symentac、EMC、飞康、爱数等公司采用的大多是快照技术,但也归入了准CDP技术行列。  
        SNIA(Storage Networking Industry Association,全球网络存储工业协会)对CDP的定义:持续数据保护是这样一种在不影响主要数据运行的 前提下,可以实现持续捕捉或跟踪目标数据所发生的任何改变,并且能够恢复到此前任意时间点的方法。CDP系统能够提供块级、文件级和应用级的备份,以及恢复目标的无限的任意可变的恢复点。

三种CDP技术PK:为什么需要块级同步保护?  在SNIA(全球网络存储工业协会)对CDP的定义,CDP连续数据保护就是在保证主要数据正常运行情况下,实现对变量数据进行跟踪,同时可以恢复到此前任意时间点的方法。一般CDP系统可以提供块级、文件级和应用级的数据保护。 那么就会有人问块级、文件级和应用级备份各自都有哪些特点?用户如何选择适合自身应用的备份方式?以下对它们做些简单的分析。
        基于应用:日志级CDP  基于应用CDP系统只针对受保护应用系统,对应用系统资源占用较大。典型的比如Oracle GoldenGate、DataGuard这些基于数据库复制的产品。主要特点是数据传输量较小,比较容易实现双活或者读写分离/备库查询。不容易做到完全同步保护(即RPO=0),由于是通过以太网的IP传输,日志型CDP对应用性能的影响相对明显一些。而且存在一些不稳定的因素,需要用户有避免写入冲突的机制,无法防御数据库底层结构的损坏。
        基于存储:数据块级和文件级  相比之下,文件级和块级CDP支持的数据类型就更多,除了数据库和文件(结构化和非结构化),可以对操作系统盘的保护(仅限块级保护)。同时,它们在备份目标上可以做到多对一。像火星舱这样的基于数据块保护的存储级CDP产品,其授权主要是针对容量和性能(高转速SAS还是近线硬盘),对于被保护客户端系统数量不限。
        文件级CDP  文件级CDP通过监测文件系统层面之上的数据变化,只需要将变量传输到备份节点或者设备。实时或者定时(严格说应该归类为“准CDP”)文件复制实现起来相对简单,但由于基于TCP/IP协议传输,受限于网络带宽及损耗,如果要达到同步对应用系统性能影响会比较大。  文件级CDP还有一个问题,就是像Oracle ASM这样由应用直接建立在裸设备上,绕过文件系统直接管理的磁盘,无法保护。
        数据块级CDP  数据块级CDP则没有这些限制,它的数据写入拆分实现位于磁盘驱动层面,在文件系统的下一层。如果是同步保护,就类似于RAID 1的镜像写入,无需磁盘缓冲区或者最多占据很少的内存。在上一篇中我们讲到火星舱的RPO=0和RTO=0就是依赖于数据块级CDP。火星舱除了支持I/O颗粒度的数据回滚——这也是“真CDP”所要求达到的,当用户部署Oracle ASM、Unix/Linux LVM的情况下,还能实现存储故障的自动接管。  数据块级CDP的一大优势是可以使用FC或者iSCSI存储网络协议,特别是前者。火星舱CDP也充分考虑到了数据一致性,对于Oracle、SQL Server等在这方面有严格要求的应用,火星舱提供了具备专利的一致性快照技术。该技术不同于传统存储的快照,采用被动式机制,感知数据库缓存刷盘的动作并在I/O记录上进行标记。保证了各种应用场合数据的有效恢复。  数据块级CDP在初始同步后也是只向目标设备写入变化数据,但在一个磁盘或者分区较大而其中存放数据的容量比例不大时,初始同步所占的时间,以及一下占用的备份空间太大(达不到精简的效果)。最新的火星舱数据保护系统5.0,在Web管理界面中加入了文件系统解析功能,可以只同步磁盘上被文件系统占用的数据块。这一点,可以说把文件级CDP的优点也结合了进来。  加密数据的保护——对于用户在操作系统下对分区进行加密的方式,火星舱能够利用CDP磁盘镜像将所有分区的状态“原封不动”复制出来,当需要访问备份数据时,密码访问口令和解密与被保护的原分区完全相同。这也是数据块级CDP的独有优势,基于文件和应用日志的保护是无法实现的。
        总结:  基于应用系统实现CDP,只针对受保护应用系统,对应用系统资源占用较大。基于文件系统,写完FAT表后,才开始复制,同时需要先读取数据;消耗大量系统资源突发增加网络带宽;基于数据块,I/O级复制技术,带外旁路(FC/IP SAN),不影响性能,块级别保护,不受OS干预。

(0)

相关推荐