集群指标收集与监控指南
1. 集群指标收集与初步监控
在小型集群中,容器数量可能过多,单一图表难以展示所有容器信息,因此我们可能需要将结果限制在单个服务上。可以通过 container_label_com_docker_swarm_service_name 过滤数据来实现这一目标。例如,查看所有 cadvisor 副本的内存使用情况,可使用以下查询:
container_memory_usage_bytes{container_label_com_docker_swarm_service_name="cadvisor"}
不过,仅使用上述方法构建的监控系统实用性有限。Prometheus 更侧重于特定查询,而非用于创建能展示整个系统视图的仪表盘。为了实现这一功能,我们需要引入 Grafana 服务。
2. 使用 Grafana 创建仪表盘
2.1 创建 Grafana 服务
首先,我们使用 Docker 创建 Grafana 服务:
docker service create \
--name grafana \
--network proxy \
-p 3000:3000 \
grafana/grafana:3.1.1
片刻后,可使用以下命令检查副本状态:
集群监控与指标收集实战
超级会员免费看
订阅专栏 解锁全文
1384

被折叠的 条评论
为什么被折叠?



