在Prometheus的报警系统中,是分为2个部分的, 规则是配置是在prometheus中的, prometheus组件完成报警推送给alertmanager的, alertmanager然后管理这些报警信息,包括静默、抑制、聚合和通过电子邮件、on-call通知系统和聊天平台等方法发送通知。
alertmanager集成报警系统的几个重要功能:
- 分组: 可以通过route书的group_by来进行报警的分组,多条消息一起发送。
- 抑制: 重要报警抑制低级别报警。
- 静默: 故障静默,确保在接下来的时间内不会在收到同样报警信息。
告警配置主要步骤如下:
- 安装和部署alertmanager
- 在prometheus中配置alertmanager的地址信息。
- 在prometheus中设置报警规则
- 在alertmanager配置接受者信息等
1、安装和部署alertmanager
整体来说,prometheus的所有套件都是比较简单的,这里提供一个简单部署方式。
# 进入下载目录
[root@node00 ~]# cd /usr/src/
# 下载alertmanager
[root@node00 src]# wget https://github.com/prometheus/alertmanager/releases/download/v0.19.0/alertmanager-0.19.0.linux-amd64.tar.gz
# 解压
[root@node00 src]# tar xf