云环境下的灾难恢复与备份策略
在当今数字化时代,数据的安全性和可用性至关重要。一旦托管服务提供商突然关闭,企业可能会面临长时间的业务中断。如果拥有多台专用服务器,在没有备用基础设施协议的情况下,可能需要数天甚至数周才能恢复运营。
传统基础设施与云环境的恢复时间目标(RTO)
在传统基础设施中,实现快速的恢复时间目标(RTO)成本极高。企业需要与另一家托管服务提供商达成协议,以提供备用基础设施或在原提供商倒闭时建立替代基础设施的服务级别协议(SLA),这可能会使 IT 基础设施成本几乎翻倍。
而云环境,即使是在虚拟化数据中心之上,也改变了我们对 RTO 的看法。云环境下的灾难恢复规划主要关注以下三个关键方面:
1. 备份和数据保留
2. 地理冗余
3. 组织冗余
如果能妥善处理这三个方面,几乎可以满足大多数恢复点目标(RPO)和恢复时间目标(RTO)的需求。但在实际情况中,预算和能力往往有限,因此这三个方面的优先级顺序很重要。如果托管服务提供商不太可靠,组织冗余可能比地理冗余更重要。
幸运的是,亚马逊云的架构使得处理备份和数据保留以及地理冗余相对容易,而云计算总体上也让组织冗余的实现变得更简单。
备份管理
恢复能力受备份质量和频率的限制。在传统 IT 基础设施中,企业通常每周进行一次完整的磁带备份,每晚进行差异备份,然后将每周的备份发送到异地。而在云环境中,通过分层备份策略可以做得更好,且成本更低。