灾难恢复、高可用性与业务连续性:概念、案例及技术解析
1. 核心概念解析
灾难恢复、高可用性和业务连续性这三个术语常被混用,且定义模糊。以下是对它们的明确界定:
- 业务连续性 :确保日常活动不受问题影响而持续进行的过程,涵盖技术和非技术灾难,如罢工或供应链问题。
- 高可用性 :保证系统尽可能长时间保持可用的过程,原因包括灾难、常规维护、补丁更新和硬件迁移等。
- 灾难恢复 :降低灾难发生可能性,并在灾难发生后使系统恢复正常的过程。
三者关系可参考图 1-1(此处虽未给出图,但概念清晰)。
2. 失败案例分析
在实际操作中,由于对这些概念理解不清,灾难恢复项目常以失败告终。以下是几个真实案例:
- 被征用的项目 :一家大公司的数据库管理团队原本计划规范数据库备份和恢复操作,明确流程并定期进行灾难恢复演练。项目名为“数据库灾难恢复”,目标明确。但后来,一位高管看到项目报告后,让团队负责人负责全公司的灾难恢复项目。由于负责人并非专业项目经理,项目缺乏结构、目标和交付成果,持续两年后无果而终,团队最终回到最初的“数据库文档”项目。
- “我们本应那样做?”项目 :一家小制造公司采用自上而下的方式制定灾难恢复计划。技术人员评估了风险并记录了恢复步骤,但当运输原材料的卡车公司员工罢工导致供应链中断时,发现恢复文档中没有相关应对措施。因为技术人员只关注了技术问题,而老板想要的是业务连续性计划,最终公司失去了一些等不及的客户。
超级会员免费看
订阅专栏 解锁全文
10万+

被折叠的 条评论
为什么被折叠?



