Kubernetes 运维与工具使用指南
1. 集群操作最佳实践
1.1 节点关闭
当不再需要某些节点时,不要直接关闭它们。应先对节点进行排水操作,确保其工作负载迁移到其他节点,并保证集群中有足够的备用容量。
1.2 自动伸缩
大多数云提供商支持自动伸缩功能,即根据某些指标或时间表自动增加或减少组中的实例数量。例如,AWS 自动伸缩组(ASGs)可以维护实例的最小和最大数量。如果一个实例发生故障,会启动另一个实例来替代它;如果运行的实例过多,会关闭一些实例。
也可以根据一天中的时间安排组的伸缩。还能配置伸缩组根据需求动态伸缩,例如,若 15 分钟内平均 CPU 利用率超过 90%,会自动添加实例,直到 CPU 使用率降至阈值以下。需求下降时,可缩小组规模以节省成本。
Kubernetes 有一个集群自动伸缩器插件,像 kops 这样的集群管理工具可以利用它来实现云自动伸缩,像 AKS 这样的托管集群也提供自动伸缩功能。不过,要正确设置自动伸缩参数可能需要一些时间和实验,而且对于许多用户来说可能根本不需要。大多数 Kubernetes 集群从小规模开始,随着资源使用的增长逐渐单调地添加节点。但对于大规模用户或需求高度可变的应用程序,集群自动伸缩是一个非常有用的功能。
最佳实践 :除非确定需要,否则不要仅仅因为有自动伸缩功能就启用它。除非需求或工作负载极其多变,否则可能不需要该功能。可以先手动伸缩集群,熟悉监控使用情况,了解规模需求随时间的变化。
1.3 一致性检查
Kubernetes 的灵活性意味着有很多不同的方式来设置集群,这可能会带来问题
超级会员免费看
订阅专栏 解锁全文
1300

被折叠的 条评论
为什么被折叠?



