- 申请163邮箱授权码
需要开启SMTP服务,然后新增授权码,复制出来授权码备用
- Grafana配置SMTP账户
vim /etc/grafana/grafana.ini
[smtp]
enabled = true #启用smtp
host = smtp.163.com:465 #邮箱的smtp的服务器地址,465默认加密端口
user = XXX@163.com #邮箱用户名
# If the password contains # or ; you have to wrap it with triple quotes. Ex """#password;"""
password = ************* #邮箱申请的授权码
#修改完邮件配置后修改domain信息,邮件内容中包含Grafana的访问地址,默认地址为localhost
41 ;domain = localhost
改为:
41 domain = 172.16.XXX.XXX #本地IP
#重启grafana
systemctl restart grafana-server
- 测试邮件是否配置成功
测试成功之后点击保存即可。
- 配置Notification policies
- 选择刚才新建的Test_send_mail
- 新建规则文件夹
- 配置告警规则
这里的版本是:grafana-8.3.0需要单独配置告警规则,我记得有一个版本是可以直接在面板里面配置。
配置完保存退出即可。
- 测试告警
- 停掉node_exporter
ps -ef |grep node_exporter |grep -v "grep" |awk '{print $2}'|xargs kill -9
- 查看告警规则
可以看到告警规则是Pending状态
- 查收邮箱
在过了五分钟之后邮箱也是收到了这个告警信息,说node_exporter已经挂掉了
- 启动node_export
nohup ./node_exporter &
启动之后告警规则这里也恢复了正常。
- 服务已经恢复
总结:到这邮件告警已经走通了,但是告警规则还是的结合自己实际去创建,我只是用进程存活来测试邮件发送是否正常,正式环境肯定不能用grafana来监控进程监控而且还配置进程邮件告警。进程监控+进程告警还是得用zabbix来完成,zabbix告警反应很快。Grafana只是看组件详细指标得,如果某个详细指标持续五分钟不正常还能被视为真正得不正常,这个告警时间还是很合理的。