容器集群监控与管理:从指标收集到云环境搭建
1. 基于指标调整服务
服务并非一成不变,Swarm 会因各种原因对服务进行重新调度。为了让 Swarm 更好地工作,我们应尽可能提供更多信息。这里主要关注 --reserve-memory 参数,后续也可将类似逻辑应用于 --reserve-cpu 、 --limit-cpu 、 --limit-memory 等参数。
操作步骤如下:
1. 在 Grafana 中点击 “Memory Usage per Container (Stacked)” 图表并选择 “View”,查看前二十个容器的内存消耗情况。
2. 从 “Service Name” 列表中选择 “prometheus” 过滤指标,发现 Prometheus 大约使用 175 MB 内存。
3. 使用以下命令为服务添加内存预留信息:
docker service update \
--reserve-memory 200m \
prometheus
这里预留 200m 内存,考虑到其内存使用可能随时间增加。需要注意的是, --reserve-memory 并非真正预留内存,而是给 Swarm 一个提示,帮助其更好地分配集群内的服务。
可以通过以下命令确认 Swarm 是否重新调度了服务:
docker
超级会员免费看
订阅专栏 解锁全文


被折叠的 条评论
为什么被折叠?



