混沌工程与持续验证:保障系统安全与可用性的新趋势
混沌工程实践要点
在进行混沌工程实践时,需要建立对平台可控性的信心,专注于识别而非制造混乱。以下是一些具体的实践方法:
- 构建组合变量实验 :虽然由于大多数组件的故障窗口较小,这种情况极为罕见,但它可以发现因公共资源耗尽等原因导致的模式。
- 自动修复漏洞 :理论上这是可行的,但在实践中,可能需要深入探讨。
同时,在混沌工程的发展过程中,也需要考虑安全实验,将其与传统的可用性实验相结合。
另外,在混沌工程的复杂性方面,存在一些反模式。最常见的反模式是开发新的实例故障方式。通常,以多种方式使实例失败并不能带来新的发现,这类实验一般可以避免。
混沌工程实验的自然发展顺序通常是从基础设施层开始,逐步向上发展到应用逻辑层,最终影响到业务逻辑层。具体如下:
1. 基础设施层 :例如著名的 Chaos Monkey 从关闭虚拟机开始。
2. 宏观层面 :Chaos Kong 在宏观层面采取类似方法,关闭整个区域。
3. 应用逻辑层 :随着工具的日益复杂,实验会影响服务之间的请求。
4. 业务逻辑层 :当变量影响业务逻辑时,会进行更复杂的实验,例如向服务提供看似合理但意外的响应。
混沌工程成熟度模型
将采用度和复杂度这两个属性作为相互正交的轴,可以得到一个映射图。从这个图的左下角开始,是由个别 S
超级会员免费看
订阅专栏 解锁全文
1001

被折叠的 条评论
为什么被折叠?



