此次上线由于个人原因导致整个开发组同事进行加班时间延长,是不太应该的情况。犯了以下几点错误:
1.测试环境bug尚未检测到位
由于同一个前端展示问题出现在两处,在开发更改完一处后,自以为另一处也会一并更改-未进行验证。导致前端同事耗费时间精力进行修复,这点很不应该。
如何避免:
①:在修复某处问题后,仔细考虑是否有其关联内容也需进行验证。
②:在业务理解上应再分配更多时间进行理解深层次业务之间的联系。
2.部分问题在预热环境上无法验证
本司的预热环境相当于另一个开发环境,主要是用于对客户进行演示以及客户进行验证。
这一点,在我之前误认为是正式环境上的可测试环境。这点是对于预热环境各种情况的接触不够多,需要本次谨记,勿与之前接触的预热环境混淆。
3.预热环境部署问题-服务启动失败
这点,虽然表面看起来关系不大,但如果说在上预热之前提前与运维沟通好,测试一下服务重启的操作,可能就会避免此类事情的发生。
本文详细回顾了一次由个人疏忽导致的上线事故,包括未充分检测测试环境的bug、对预热环境理解不足及服务部署问题。作者深入剖析了事故原因,并提出了改进措施,如增强业务理解、加强环境认知及与运维团队的沟通。
1148

被折叠的 条评论
为什么被折叠?



