监控系统基础:从核心指标到Prometheus生态搭建
1. 监控的核心指标方法
1.1 Google的四个黄金信号
Google提出在监控中,有四个最重要的指标:
- 延迟(Latency) :处理一个请求所需的时间。
- 流量(Traffic) :正在发出的请求数量。
- 错误(Errors) :失败请求的比率。
- 饱和度(Saturation) :未处理的工作量,通常是排队的任务。
1.2 Brendan Gregg的USE方法
该方法更侧重于机器层面,针对每个资源(如CPU、磁盘、网络接口等),应监控以下指标:
- 利用率(Utilization) :资源处于忙碌状态的百分比。
- 饱和度(Saturation) :资源无法处理的工作量,通常是排队的任务。
- 错误(Errors) :发生的错误数量。
1.3 Tom Wilkie的RED方法
RED方法更关注服务层面,而非底层系统本身。该方法的指标包括:
- 速率(Rate) :每秒的请求数。
- 错误(Errors) :每秒失败的请求数量。
- 持续时间(Duration)
超级会员免费看
订阅专栏 解锁全文
9670

被折叠的 条评论
为什么被折叠?



