1 项目目标
(1)熟练部署alertmanager
(2)熟练整合alertmanager+Prometheus
(3)熟练alertmanager分组、抑制、静默
2 项目准备
2.1 规划节点
主机名 |
主机IP |
节点规划 |
prome-master01 |
10.0.1.10 |
服务端 |
prome-node01 |
10.0.1.20 |
客户端 |
2.2 基础准备
系统镜像:centos7.9
安装包下载网址:Releases · prometheus/alertmanager (github.com)
环境准备:详情看我主页前几篇文章
3 项目实施
3.1 alertmanager简介及部署
Alertmanager处理由诸如Prometheus服务器之类的客户端应用程序发送的警报。
核心功能点
英文 |
中文 |
含义 |
deduplicating |
重复数据删除 |
prometheus产生同一条报警 |
grouping |
分组 |
告警可以分组处理,同一个组里共享等待时长等参数 |
route |
路由 |
路由匹配树,可以理解为告警订阅 |
silencing |
静默 |
灵活的告警静默,如按tag |
inhibition |
抑制 |
如果某些其他警报已经触发,则抑制某些警报的通知 |
HA |
高可用性 |
gossip实现 |
去这里下最新版Releases · prometheus/alertmanager (github.com)
wget https://github.com/prometheus/alertmanager/releases/download/v0.27.0/alertmanager-0.27.0.linux-amd64.tar.gz
tar xf alertmanager-0.27.0.linux-amd64.tar.gz -C /usr/local/
mv /usr/local/alertmanager-0.27.0.linux-amd64/ /usr/local/alertmanager
vim /usr/lib/systemd/system/alertmanager.service
[Unit]
Description="alertmanager"
Documentation=https://alertmanager.io/
After=network.target
[Service]
Type=simple
ExecStart=/usr/local/alertmanager/alertmanager --config.file=/usr/local/alertmanager/alertmanager.yml --storage.path=/usr/local/alertmanager/data/
Restart=on-failure
RestartSecs=5s
SuccessExitStatus=0
LimitNOFILE=65536
StandardOutput=syslog
StandardError=syslog
SyslogIdentifier=alertmanager
[Install]
WantedBy=multi-user.target
systemctl start alertmanager
systemctl enable alertmanager
systemctl status alertmanager
访问IP:9093