Kubernetes 监控与日志记录全解析
1. 分层监控方法
采用分层监控方法,能让你更轻松地在监控系统中识别正确的信号,以更有针对性的方式处理问题。例如,当 Pod 进入挂起状态时,可先检查节点的资源利用率;若一切正常,再排查集群级组件。
以下是系统中需要关注的指标:
- 节点 :
- CPU 利用率
- 内存利用率
- 网络利用率
- 磁盘利用率
- 集群组件 :
- etcd 延迟
- 集群插件 :
- 集群自动伸缩器
- 入口控制器
- 应用程序 :
- 容器内存利用率和饱和度
- 容器 CPU 利用率
- 容器网络利用率和错误率
- 应用框架特定指标
2. 监控工具
许多监控工具都能与 Kubernetes 集成,且新工具不断涌现。以下是一些流行的与 Kubernetes 集成的工具:
| 工具名称 | 描述 |
| ---- | ---- |
| Prometheus | 开源的系统监控和警报工具包,最初由 SoundCloud 开发,现由 CNCF 托管,具有多维数据模型,以人类可读格式暴露指标。 |
| InfluxDB | 时间序列数据库,能处理高写入和查询负载,是 TICK 栈的组成部分,适用于处理大量带时间戳的数据。 |
| Datadog | 为云规模应用提供监控服务,通过基于 Saa
超级会员免费看
订阅专栏 解锁全文
1031

被折叠的 条评论
为什么被折叠?



