Kubernetes 监控与日志管理指南
1. 分层监控方法
采用分层监控方法能让你更轻松地在监控系统中识别正确的信号,并以更有针对性的方式处理问题。例如,当 Pod 进入待处理状态时,你可以先检查节点的资源利用率;若一切正常,再将目标转向集群级组件。
需要监控的指标如下:
- 节点 :CPU 利用率、内存利用率、网络利用率、磁盘利用率。
- 集群组件 :etcd 延迟。
- 集群插件 :集群自动缩放器、Ingress 控制器。
- 应用程序 :容器内存利用率和饱和度、容器 CPU 利用率、容器网络利用率和错误率、应用框架特定指标。
2. 监控工具
许多监控工具都能与 Kubernetes 集成,以下是一些流行的工具:
| 工具名称 | 描述 |
| ---- | ---- |
| Prometheus | 开源的系统监控和警报工具包,最初由 SoundCloud 开发,现由 CNCF 托管。它采用多维数据模型,与 Kubernetes 标签、服务发现和元数据有良好的集成。 |
| InfluxDB | 时间序列数据库,用于处理高写入和查询负载,是 TICK 栈的组成部分,适用于 DevOps 监控、应用程序指标等场景。 |
| Datadog | 基于 SaaS 的数据分析平台,为云规模应用程序提供服务器、数据库、工具和服务的监控。 |
| Sysdig | 商业工具,提供 Docker 和 Kuberne
超级会员免费看
订阅专栏 解锁全文
1319

被折叠的 条评论
为什么被折叠?



