在监控系统中(如 Prometheus 和 Alertmanager),"severity": "page"
是一个标签(label)或字段值,通常用来表示警报的严重性等级。具体来说:
-
severity:表示警报的严重性(Severity),是一个常见的字段,用于指示问题的紧急程度或需要处理的优先级。
-
“page”:在这种情况下,“page” 通常表示一个非常严重的警报,需要立即关注和处理。具体来说,它可能指示该警报需要触发一个通知到页面(如通过电话、短信或其他紧急通知渠道)来通知责任人。这个级别通常会触发最紧急的通知方式,确保问题能尽快得到响应。
常见的严重性级别
severity
字段通常有多个级别,可以根据项目或组织的实际需求进行定义。常见的严重性级别包括:
- “page”:最紧急的级别,表示需要立即响应,通常会触发紧急的通知,如短信、电话等。
- “critical”:高优先级警报,问题需要尽快解决,可能影响系统的正常运行。
- “warning”:较低优先级的警报,表示系统存在问题,但不至于马上造成影响。通常是需要监控的问题。
- “info”:信息级别的通知,表示某些重要的事件或状态变化,但不需要立即处理。
使用场景
如果某个系统(如 Prometheus)监控到一个关键服务的故障或系统不可用,可能会通过以下方式定义警报: