构建高可扩展与高可用系统的全面指南
1. 系统监控的重要性
系统监控绝非枯燥之事。若追求 99.999% 的可用性,就不能对任何事掉以轻心,要监控一切,并定期手动和自动审查警报、日志和指标。因为你永远不知道自己或工具会发现什么问题,而这些问题往往会在你最意想不到的时候出现。
即便已在功能、进程、应用程序和节点层面隔离了故障,也不意味着允许进程崩溃是可接受的。“让它崩溃”的方法能提供简化编程模型以减少崩溃,但要确保能及时察觉故障并尽快修复,在用户发现之前做出反应。
此外,不要浪费时间大海捞针,要随时掌握所有数据,以便在异常出现时证明自己的清白(或承认错误)。
2. 设计可扩展和高可用系统的步骤
设计可扩展和高可用系统可遵循以下 10 个简单步骤:
1. 拆分系统功能 :将系统功能拆分为可管理的独立节点。
2. 选择分布式架构模式 :确定适合系统的分布式架构模式。
3. 选择网络协议 :为节点、节点家族和集群之间的通信选择合适的网络协议。
4. 定义节点接口、状态和数据模型 :明确节点的接口、状态和数据模型。
5. 选择重试策略 :为节点中的每个接口函数选择重试策略。
6. 确定数据共享策略 :考虑重试策略的需求,为所有数据和状态选择在节点家族、集群和类型之间的共享策略。
7. 设计系统蓝图 :考虑节点比例以实
高可扩展与高可用系统设计指南
超级会员免费看
订阅专栏 解锁全文
26

被折叠的 条评论
为什么被折叠?



