读书笔记(SRE:Google运维解密):第13章 紧急事件响应

这篇博客强调了从事故中学习的重要性,提倡详细记录事故并公开分享,以便全员能从中汲取教训。同时,鼓励提出大胆的假设性问题以预防潜在问题,并推动主动进行系统测试,以提升整体战略和战术应对能力。
  • 向过去学习,而不是重复它
    (a)为事故保留记录:在记录中,请一定要诚实,一定要事无巨细。尤其重要的是,提出关键的问题。时刻寻找如何能在战术及战略上避免这项事故的发生。公布和维护事后报告,确保全公司的每个人都能从中学到你所学到的知识。
    (b)提出那些大的,甚至不可能的问题:假如……
    (c)鼓励主动测试
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值