系统风险管理与构建低风险系统策略
1. 风险管理概述
风险管理的核心在于理解消除风险和减轻风险之间的平衡。这需要判断是消除风险,还是仅仅降低风险影响,哪种方式更谨慎、及时且具有成本效益。
2. 恢复计划
2.1 恢复计划的定义与作用
当已知风险发生时,需要应对其后果。恢复计划可以提供一系列已知的行动,用于处理这些后果并修复风险引发的问题。恢复计划通常不影响风险发生的可能性,而是降低其严重程度。它是一种特定类型的风险缓解措施,详细描述了已知风险发生时应采取的行动,包括:
- 尽快停止问题的行动;
- 实施变通方案以减少问题影响的行动;
- 告知客户问题情况以及他们可采取的减少影响措施的信息;
- 升级流程以及通知公司内部相关人员的机制,确保公司各部门能理解并处理问题及其后续影响。
2.2 恢复计划的内容
一个完善的恢复计划应提前制定,作为特定风险缓解计划的一部分。当问题发生(即风险触发)时,每个人都清楚如何从问题中恢复。恢复计划应包含以下内容:
- 触发恢复计划实施的具体细节;
- 实施恢复计划所需涉及的人员列表;
- 实施恢复计划的详细步骤说明,以及负责执行这些步骤的人员;
- 需要通知的管理层和其他团队;
- 问题解决后必须进行的后续跟进工作。
恢复计划应存储在团队成员都熟知的位置,如支持手册或内部支持 intranet。执行恢复计划后,应对问题进行事后分析,并评估恢复计划是否需要改进或调整。
2.3 数据库灾难性故障的恢复计划示例
以数据库灾难性故障的恢
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



