- 博客(1)
- 收藏
- 关注
原创 SRE_Google运维解密_笔记
1.70%的事故由变更引起 2.谷歌的SRE倾向于DEVOPS,兼顾效率(快速上线更新)与质量(降低事故率) 3.SRE大致发展历程:手动(凭经验容易误操作)→自动→智能 4.缓慢的不断重启的实例优于永不重启泄露资源的实例 5.SLA(service level agreement):请求延迟;错误率;系统吞吐量(QPS);可用性;持久性 SLO(object):SLI的目标范围 SLI(indicator):从目标反推指标 6.多创新,少做琐事(DRY),但合理的琐事有助于放松 7.监控系
2022-10-18 22:09:51
1220
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人