系统监控与日志分析全解析
1. 监控基础概念
1.1 告警机制
告警是指将某件事引起某人或另一个系统的注意。例如,QPS(每秒查询率)的突然下降可能会触发告警,通知值班人员。通常,告警需要在一定时间内得到确认。如果超过了截止时间,就会通知其他人,这个过程称为升级。
1.2 可视化作用
可视化有助于更深入地了解系统,从设计、规划到沟通等各个方面都能发挥作用。趋势分析可用于容量规划。告警则用于提醒人们可能导致系统故障的情况,也可作为系统故障发生时的最后警告手段。
1.3 服务管理术语
| 术语 | 定义 | 示例 |
|---|---|---|
| 服务水平指标(SLI) | 关于如何进行测量的协议,定义了测量内容、测量方式和测量视角 | 定义网站可用性的测量方式 |
| 服务水平目标(SLT) | 服务的目标质量,即 SLI 的预期最小值或最大值 | 网站可用性达到 99.99% |
| 服务水平协议(SLA) | 规定 SLI、SLT 以及未达到 SLT 时的惩罚措施的合同 | outage 超过一小时需退款或支付罚款 |
超级会员免费看
订阅专栏 解锁全文
2470

被折叠的 条评论
为什么被折叠?



