灾备
大家好,今天和大家聊聊灾备。灾备是容灾和备份的简称
- 备份的定义:指用户为应用系统产生的重要数据(或者原有的重要数据信息)制作一份货多分拷贝,以增强数据的安全性
- 容灾的定义:指在相隔较远的两地(同城或者异地)建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换。当一处系统因意外(天灾、人祸)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。
灾备方案的组成
备份方案+容灾方案=灾备方案
备份方案产生的逻辑
天灾人祸导致的故障场景
1、误操作、程序BUG等导致产生脏数据或数据误删除
2、服务器故障,如宕机、硬盘损坏等
3、机房内部网络设备故障,如宕机、路由配置错误等
4、因火灾、光缆挖断、掉电、运营商故障等原因导致机房不可用
5、地震、洪水等地域性自然灾害
故障产生的不良后果
1、数据丢失OR数据不可用——应对思路:数据备份及恢复
2、IT系统功能异常、完全或部分不可用、业务中断——应对思路:系统高可用
问题的应对思路关注点
数据备份及恢复:1、备份方法。2、备份的保存。3、备份的恢复。
系统高可用:1、消灭单点。2、数据同步
RTO与RPO
RTO和RPO
恢复时间目标(RTO:Recovery Time Object)
-指灾难发生后,从IT系统宕机导致业务停顿时开始,到IT系统恢复至可以支持各部门运作,业务恢复运营之时,此两点之间的时间段称为RTO。
-RTO是反映业务恢复及时性的指标,体现了企业能容忍的IT系统最长恢复时间,RTO值越小,代表容灾系统的恢复能力越强,但企业投资也越高。
恢复点目标(RPO:Recovery Point Object)
-指灾难发生后,容灾系统进行数据恢复,恢复得来的数据所对应的时间点称为RPO。
-RPO是反映数据丢失量的指标,体现了企业能容忍的最大数据丢失量的指标。RPO值越小,代表企业数据丢失越少,企业损失越小。
设计灾备方案的核心内容
-平衡RTO和RPO的需求,找