大规模部署探索
1. 集群管理节点分布
在集群中,将管理节点分布到更多可用区(AZ)能提升稳定性。以五个管理节点和五个可用区(1 - 1 - 1 - 1 - 1布局)为例,由于法定人数至少需要三个节点,即使五个可用区中有两个不可用,集群仍能正常运行,相比3 - AZ拓扑,容错能力提高了100%。不过,不同地理区域间的通信会增加更新延迟。
2. 节点自动化
使用Packer制作亚马逊机器映像(AMIs)时,我们能看到预烘焙实例映像的作用。当整个基础设施都由这些映像组成时,其真正威力才能完全发挥。若编排管理节点和工作节点有各自的系统映像,并通过初始化系统(如systemd启动服务)嵌入启动脚本,使用这些映像启动的实例就能在启动时以预定义角色自动加入集群。进一步将所有有状态配置提取到映像配置中,将动态配置提取到所有节点都可访问的单独服务(如EC2用户数据或HashiCorp Vault)中,除了初始部署和映像构建,集群几乎能实现完全自配置。
这种强大的自动加入功能可减少集群扩展或缩减时的手动工作,只需启动虚拟机实例即可。但要注意,在配置服务布局中,需分离和隔离敏感信息,确保只有指定系统可访问,遵循安全最佳实践,防止单点故障扩散到整个集群。
3. 响应式自动扩展
实现自动化自配置后,可进一步自动启动实例。多数云服务提供商支持自动扩展组自动化,通过使用启动配置和预配置映像,添加或删除节点就像调整所需节点设置一样简单。自动扩展组会增加或减少工作实例数量,由于映像是自配置的,用户只需进行简单输入。
部分云提供商还可根据指标或类似cron的时间表触发自动扩展组的操作。例如,集群负载增加时触发节点数量增加;集群
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



