Prometheus告警规则与Alertmanager配置详解。

最新推荐文章于 2025-12-17 17:41:55 发布

原创最新推荐文章于 2025-12-17 17:41:55 发布 · 383 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能

Prometheus 告警规则基础

告警规则是Prometheus监控系统的核心组件之一，用于定义何时触发告警。告警规则通常存储在*.rules文件中，并通过Prometheus的配置文件加载。一个典型的告警规则文件包含以下几个部分：

规则组（groups）：逻辑上相关的告警规则集合。
规则名称（name）：唯一标识告警规则的名称。
表达式（expr）：PromQL查询表达式，用于触发告警的条件。
标签（labels）：附加到告警的元数据。
注解（annotations）：告警的详细描述信息。

以下是一个示例告警规则文件：

groups:
- name: example
  rules:
  - alert: HighRequestLatency
    expr: job:request_latency_seconds:mean5m{job="myjob"} > 0.5
    for: 10m
    labels:
      severity: page
    annotations:
      summary: High request latency on {{ $labels.instance }}
      description: "{{ $labels.instance }} has a high request latency ({{ $value }} seconds)"