Alertmanager定时静默效果

背景

在每天晚上21点到凌晨1点,内部会有数据任务在执行,导致相关机器的内存会出现突增,触发电话告警。为了解决这个问题,决定使用amtool工具进行定时静默操作。

环境说明

组件名称组件版本
alertmanagerv0.27.0

安装Alertmanager

  1. 下载合适的压缩包文件
wget -O /data/ https://github.com/prometheus/alertmanager/releases/tag/v0.27.0
  1. 解压
tar -zxf alertmanager-0.27.0.linux-amd64.tar.gz
  1. 启动alertmanager
/data/alertmanager-0.27.0/alertmanager
    --config.file=alertmanager.yml #指定配置文件路径
    --web.listen-address=":9093" #指定web端口
    --log.level=debug #指定日志级别
    --storage.path=data/ #指定数据存储目录
    --web.route-prefix="/alertmanager" #指定web访问路径

使用amtool工具

创建配置文件

Config File: The alertmanager tool will read a config file in YAML format from one of two default config locations: $HOME/.config/amtool/config.yml or /etc/amtool/config.yml

[root@xxx alertmanager] cat /etc/amtool/config.yml
alertmanager.url: "http://127.0.0.1:9093/alertmanager" #alertmanager地址
author: "auto" #这里配置的标识silence的作者
comment_required: true #是否需要添加描述内容
output: "simple" #设置输出格式

告警操作

手动创建告警
[root@xxxx alertmanager]# ./amtool alert add foo instance=bar --annotation=summary='summary of the alert' --annotation=description='description of the alert'
效果查看

在这里插入图片描述

查看告警列表
[root@xxx alertmanager]# ./amtool alert query
Alertname                         Starts At                Summary  State
foo                               2025-08-04 16:57:50 +0800  summary of the alert  active      
带有条件的告警列表
[root@xxx alertmanager]# ./amtool alert query  'alertname=fo'
[root@xxxx alertmanager]# ./amtool alert query  'alertname=foo'
效果查看

在这里插入图片描述

silence操作

创建silence

--comment:增加描述信息
-h:指定静默事件

[root@xxxx alertmanager]# ./amtool silence add --comment="hello world " -d 2h alertname="foo" instance="bar"
cf90c070-f3f8-4bdc-a4ad-bd38692d4ca4
效果查看

在这里插入图片描述

取消静默
[root@xxxx alertmanager]# ./amtool silence  expire cf90c070-f3f8-4bdc-a4ad-bd38692d4ca4 #可以影响多个
查看静默
[root@xxxx alertmanager]# ./amtool silence query

在这里插入图片描述
ID是这个silence的唯一ID,Matchers表示的匹配规则标识,End At表示结束时间,Create By表示创建人,Comment表示描述信息。

实战

告警的详细信息

在这里插入图片描述

设置定时静默效果

  1. 配置Crontab
0 21 * * * /data/alertmanager/amtool silence add --comment="屏蔽内存告警 " -d 1h alertname="host_memory_use_warning" idc="awsxxx" instance="xxx" namehost="xxxxx-prod-01" severity="warning"

需要注意的是:Matchers尽量全部匹配上,否则可能会有不生效的情况。

  1. 查看效果
    在这里插入图片描述
    可以看到,silence已经成功创建了,影响的alert信息也在下方展示了,生效时间也与配置的相同。

结语

至此,我们可以通过amtool工具进行alertmanager的定时silence,防止一些运维任务导致的告警,还要给运维打电话,可以美美睡觉了。

### 如何在 Prometheus Alertmanager 中取消或关闭静默告警配置 在 Prometheus 的生态系统中,Alertmanager 是用于处理和路由告警的核心组件之一。它支持多种功能,其中包括告警静默(Silence)。如果希望停止使用静默功能或者移除已有的静默设置,则可以通过以下方式操作。 #### 移除现有的静默配置 静默是在 Alertmanager Web 界面中创建的一种临时规则,用于忽略特定条件下的告警触发。这些静默不会存储在任何配置文件中,而是保存在 Alertmanager 的内部状态数据库里。因此,要完全清除所有的静默记录,可以采取以下方法: 1. **手动删除静默** 登录到 Alertmanager 的 Web 控制台页面,默认地址为 `http://<alertmanager-host>:9093`。导航至 “Silences” 页面,在这里可以看到当前存在的所有静默条目。点击对应的静默项并选择“Delete”,即可将其移除[^2]。 2. **重启 Alertmanager 实例** 如果需要一次性清空所有现存的静默设定而不逐一手动删除,可以选择重新启动 Alertmanager 进程。这会重置其内存中的数据结构,从而丢弃之前定义的所有静默实例。注意,这种方法仅适用于那些未被持久化的静默;即它们并非由外部工具自动注入的情况。 ```bash systemctl restart alertmanager ``` #### 防止新静默的建立 为了防止未来再次意外启用静默机制,可考虑调整访问权限策略: - 对于基于浏览器的操作界面,限制能够进入 Silence 创建区域用户的认证级别; - 或者修改 API 调用的安全控制逻辑,使得未经授权的服务无法调用 `/api/v2/silences` 接口来新增静默对象。 需要注意的是,以上措施只是阻止新的静默生成,并不影响已经生效的历史记录清理工作[^1]。 ```yaml # 示例:Prometheus YAML 文件片段展示如何指定目标地址给 Alertmanager 使用 alerting: alertmanagers: - static_configs: - targets: - '192.168.100.10:9093' ``` 尽管如此,实际生产环境中通常不建议彻底禁用静默特性,因为它是应对计划维护期间减少干扰的有效手段之一。相反,应该优化流程管理和培训团队成员正确运用这一强大工具。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值