分布式系统中的 Akka 集群:原理、配置与应用
1. 分布式系统前期考量
在构建系统时,Akka 能让部署决策更多地成为配置项而非代码层面的问题。拥有多个代码库能极大地便利大型团队协作,避免布鲁克斯法则带来的问题,即给已经延期的项目增加资源会让项目延期更久。通过消除通信渠道和将代码提交隔离到不同的仓库,可避免合并冲突。
在系统复杂度高到难以以单体形式管理,或者有基于数据的充分理由(如性能或团队工作量相关)时,再考虑构建分布式系统。无论一开始决定构建单体应用还是服务,都应从第一天起将不同的关注点封装到库中,这样在准备部署独立应用前,团队就能从不同代码库协作中受益,后续拆分应用时也更易管理代码共享。
2. 集群的定义与功能
集群是一组相互通信的服务器,集群中的每个服务器称为节点或成员。集群需具备动态调整规模和在故障时将影响降至最低的能力,主要承担两项职责:故障检测和在集群内传播所有可用成员的一致视图。
3. 故障检测机制
随着节点数量增加,节点故障或网络临时分区的可能性增大,集群是动态实体,服务器关闭或不可用时会缩小,添加服务器时会扩大。节点通过向其他成员发送消息来判断其是否可用,依据回复情况确定成员的可用性。
为降低监控其他节点健康状况的复杂度,Akka 中的故障检测仅监控节点相邻的一定数量的节点。例如,在一个由六个节点组成的集群环中,每个节点可能监控其后的两个节点是否故障,Akka 集群中每个节点默认最多监控五个节点。
在 Akka 中,故障检测通过节点间发送心跳并接收响应来实现。Akka 根据心跳历史和当前心跳计算节点可用的可能性,并结合配置的容差阈值标记节点为不可用或
超级会员免费看
订阅专栏 解锁全文
507

被折叠的 条评论
为什么被折叠?



