集群监控、服务器管理与AWS集群搭建指南
1. 基于仪表盘指标调整服务
服务并非一成不变,Swarm会因各种原因对服务进行重新调度,如每次发布、副本失败、节点不健康等。我们应尽可能为Swarm提供更多信息,对服务期望状态描述得越清晰,Swarm的工作效果就越好。
这里我们重点关注 --reserve-memory 参数,后续也可将类似逻辑应用于 --reserve-cpu 、 --limit-cpu 、 --limit-memory 等参数。
1.1 观察内存指标并更新服务
在Grafana中观察内存指标并相应更新服务,具体操作步骤如下:
1. 点击Grafana中的 “Memory Usage per Container (Stacked)” 图表并选择 “View”,会看到一个放大的图表,显示前二十个容器的内存消耗情况。
2. 从 “Service Name” 列表中选择 “prometheus” 过滤指标。发现Prometheus大约使用175MB内存,为服务添加该信息:
docker service update \
--reserve-memory 200m \
prometheus
这里预留了200m内存,考虑到其内存使用量可能随时间增加,所以预留量比当前需求略多。需要注意的是, --reserve-memory 并非真正预留内存,而是给Swarm
超级会员免费看
订阅专栏 解锁全文
2250

被折叠的 条评论
为什么被折叠?



