深入解析值班分工与事件管理
值班分工的争议与解决思路
在职业领域中,关于谁应该承担值班职责的分歧一直是令人困扰的问题。各方的争论都有其合理性,但即便如此,这场辩论仍然充满争议。通常在大家分享观点和个人经历后,会达成暂时的休战,得出“视情况而定”的结论。然而,这个答案并没有真正解决或终结争论,也没有触及问题的核心。
无论处于DevOps世界的哪种模式,系统的设计、构建和运营方式差异很大,但大多数人都认同两点:值班角色是必要的,且大多数人都不太愿意承担。每个人的值班经历都是宝贵的,这些经历能提供比日志和指标更真实的信息。如果我们的目标是改善值班体验,就需要关注个人经历中的实际情况和对人的影响。
要解决值班分工的问题,首先要为大家提供分享和倾听的时间与空间,探索应对问题前后的认知过程。但目前在回顾分析中,我们还没有找到有效的方法来纳入对人们心理活动、认知推理、判断和决策机制的认可与探索。我们需要深入探究分歧背后的原因,通过创造安全的环境来揭示值班期间的完整情况,从而减少值班的困扰,缩小分歧。
事件响应的大师经验
首次担任事件管理值班人员(IMOC)时,往往会表现不佳。不过,随着经验的积累,可以建立一个高级别的事件管理框架。以下是事件管理的主要原则:
1. 止血原则 :始终将重点放在优先缓解问题上。尽管讨论可能会转向深入的根本原因调查和长期解决方案,但首要任务是恢复当前状况。
2. 了解各方行动 :定期询问每个人在做什么,以跟踪工作进展,避免工作重叠,并获取相关方的健康检查信息。同时,借此机会询问是否需要帮助,以确定是否需要调配更多资源。
超级会员免费看
订阅专栏 解锁全文
31

被折叠的 条评论
为什么被折叠?



