第一章 背景及概述
随着云计算、虚拟化、大数据等一系列技术的不断发展,为企业及政府单位的数字化转型奠定了扎实的技术基础。通过数字化转型,能够打造灵活高效的业务流程、创新的商业模式,实现降低人力资本投入、增加营收等目标。一般来讲核心业务应用多数运行在PC Server、小型机、虚拟机上,但是在没有任何应急预案防护措施下,企业的信息化系统可能面临着严重的威胁和风险,如病毒感染破坏、黑客攻击、软件故障、误操作、硬盘故障或人为破坏等,由此会造成系统失常、文件损坏或丢失、运营中断,更有甚者会引起数十台至数百台主机系统崩溃,导致所有系统信息和用户数据丢失的严重后果。此外,数字化转型所带来的更复杂的 IT 架构,更庞大的数据量,更智能化的 IT 管理等趋势也给企业在数据管理及保护方面带来了更多挑战。目前主要的数据管理保护及应用难题包括如下几个方面:
■ 数据量激增,传统备份效率低下,占用生产资源高,占用空间大,数据还原出错概率大
■ 备份数据恢复时间长,且无法有效验证备份数据可用性
■ 误操作、误删除等逻辑错误的防范
■ 勒索病毒等安全威胁
■ 开发环境、测试环境的搭建耗费大量人力物力
■ 数据合规检查、数据抽取平台、报表统计分析影响生产环境
灵备CDM一体机利用“副本管理”技术来解决上述问题。灵备CDM系统通过原生格式数据捕获、永久增量等备份等技术,提升备份效率,节约存储资源。若生产数据丢失或损坏,可通过副本虚拟化和即时挂载技术,实现任意时间点分钟级数据恢复,满足更高的SLA要求。灵备CDM系统包含了对Oracle数据库、SQL Server数据库、MySQL数据库、文件系统以及VMware虚拟机系统的数据保护,用户可以通过部署灵备CDM系统实现对数据库、文件系统以及虚拟机系统的保护,同时满足备份副本的再利用,即开发、测试环境搭建,数据分析等副本数据使用需求。
第二章 产品概述
2.1 数据库备份演进
2.1.1 传统备份
传统备份软件是基于磁带技术为核心发展起来的,数据备份集格式采用的是适合流媒体介质的格式,适合批量的顺序写(备份)和读(恢复)。备份数据获取技术可以概括为以下三类:
1.LAN(Local Area Network,局域网)备份:备份数据通过IP网络从生产服务器传输到备份设备。LAN备份方式一般用于数据量较小的应用。
2.LAN-Free备份:备份数据通过FC 网络从生产服务器传输到备份设备。LAN-Free备份方式一般用于大数据量的应用。
3.Server-Free备份:采用上述备份方式均需要生产服务器长时间进行备份,导致大量的IO 资源消耗,影响生产稳定。Server-Free备份基本不需要生产服务器参与整个备份过程,其实现方式是备份设备直接从生产存储获取数据(生产存储对应用数据做快照)后挂载快照,再将快照备份。这种方式能将备份的资源消耗从服务器转移到存储上,从而减少对生产的影响。Server-Free备份方式需要存储系统的支持。
虽然传统备份软件一直在优化进步,但远远跟不上数据量增长的速度以及业务对数据恢复的要求。以10 TB 的数据库为例,如果备份设备硬件配置高,则可以达到2 TB/h,即需5 h实现全量备份。在这个速度下,生产服务器的资源消耗巨大,且10 TB数据的恢复时间至少要2天以上。
2.1.2 CDP连续数据保护
从功能上看,CDP(Continual Data Protection,连续数据保护)比较适合解决前述备份软件的问题。它能提供数据备份,快速恢复数据。CDP的原理是通过截取生产应用的写操作并传输到CDP设备中,将写操作按次序保存下来。当需要恢复时,CDP可以根据这些写操作虚拟出一块磁盘,再挂载给服务器。CDP技术减少了传统备份在恢复时需要将数据从备份设备恢复到目标存储的过程,实现分钟级的恢复,恢复时间和数据量的大小没有关系,也不需要有专门的备份窗口。由于保存了写操作,所以它可以恢复到任意时间点。
但CDP技术在架构上有一个很重要的前提是:它必须集成到生产系统的IO链路中,并以同步方式截取写操作。它必须保存写操作的顺序,也不能有任何写操作的缺失,所以这个写入CDP的操作和生产系统的写操作必须是一个同步的关系,因此CDP备份方式数据还原出错概率大。同时由于每一个写操作都会有两份数据写到存储中,这样会极大地提高对生产资源的占用,影响生产系统的IO性能。此外, CDP备份也要求备份存储的性能必须要和生产存储的性能是基本等同的,对成本的要求也极高。
由于客观条件的限制,CDP技术在推出多年之后 仍然没有取代传统备份技术。它在中小企业IT系统中 使用相对多一些,但较少在大型企业的核心系统中使用。
2.1.3 CDM副本管理
CDM(Copy Data Management,复制数据管理)技术是一种创新型的备份技术。Gartner认为在两个场景中可以提供非常高效的解决方案:一是备份恢复的现代化;二是开发测试环境的快速搭建。
CDM的核心技术是备份出来的数据格式是原始格式,即备份数据可以直接挂载给目标服务器实现分钟级恢复,和数据量的大小无关,这是和传统备份软件 最大的区别。由于备份数据是原始数据格式,并且存放在磁盘上,所以它可以根据新的增量数据和已有的全备数据,在备份系统内合成新的全量备份,从而实现永远增量备份。
由于CDM本身是一种备份技术,所以它可以应对各种宕机场景,包括逻辑错、人为错等大概率小事故。增量备份和增量合成功能可以极大地降低备份窗口以及备份时系统资源的消耗。并且它还可以实现分钟级的恢复时间,满足业务对恢复的时间要求。
除此之外,CDM的即时挂载等技术可以对备份的副本分钟级拉起,提供给开发、测试环境、以及数据报表输出等非生产环境使用,让备份的数据活起来,利用起来。
2.2 灵备CDM系统简介
灵备CDM系统是专为保护数据库系统、文件系统、虚拟机系统而设计的集成系统。灵备CDM系统可为关键数据库和文件系统提供持续保护,同时将所有备份处理从生产服务器分流出去,从而极大限度地降低开销。灵备CDM系统具备高可扩展性,只需一台设备即可满足数千数据库的数据保护需求。
灵备CDM系统采用CDM架构,支持主流文件系统、数据库、虚拟化系统的原始数据格式