74:告警系统邮件引擎 运行告警系统

本文介绍如何使用Python和Zabbix构建告警系统邮件通知机制,通过自定义的mail.py和mail.sh脚本实现故障告警的收敛,避免误报,并确保在服务长时间未恢复时及时通知管理员。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、告警系统邮件引擎

因为之前做zabbix的时候,用过mail.py,这里直接调用就可以了:

但是告警邮件引擎核心,conf主配置文件调用到的都是mail.sh,所以这里需要定义调用mail.py的sh脚本:

mail.sh的目录是做告警收敛目的就是1分钟前发现问题,然后到10分钟后,服务还没有恢复,就会告诉管理人员10分钟了服务还未恢复:,如果不做告警收敛,在发现问题的时候直接告警就好,但是,可能会发生1分钟前发现问题,1分钟户问题解决,这样就会变成误报,这样会很麻烦:

1:首先需要在/usr/local/bin/mail/定义两个文件:  mail.py    mail.sh

mail.py的内容

[root@localhost_01 mail]# cat mail.py 
#!/usr/bin/env python
#-*- coding: UTF-8 -*-
import os,sys
reload(sys)
sys.setdefaultencoding('utf8')
import getopt
import smtplib
from email.MIMEText import MIMEText
from email.MIMEMultipart import MIMEMultipart
from  subprocess import *

def sendqqmail(username,password,mailfrom,mailto,subject,content):
    gserver = 'smtp.163.com'
    gport = 25

    try:
        # msg = MIMEText(unicode(content).encode('utf-8')) //如果发送的邮件有乱码,可以尝试把这行改成如下:
        msg = MIMEText(content,'plan','utf-8') 
        msg['from'] = mailfrom
        msg['to'] = mailto
        msg['Reply-To'] = mailfrom
        msg['Subject'] = subject

        smtp = smtplib.SMTP(gserver, gport)
        smtp.set_debuglevel(0)
        smtp.ehlo()
        smtp.login(username,password)

        smtp.sendmail(mailfrom, mailto, msg.as_string())
        smtp.close()
    except Exception,err:
        print "Send mail failed. Error: %s" % err


def main():
    to=sys.argv[1]
    subject=sys.argv[2]
    content=sys.argv[3]
    sendqqmail('yzhm188@163.com','授权码','yzhm188@163.com',to,subject,content)

if __name__ == "__main__":
    main()

mai.sh的内容如下:

[root@localhost_01 mail]# vim mail.sh 
#!/bin/bash
log=$1   
t_s=`date +%s`
t_s2=`date -d "2 hours ago" +%s`  //定义2个小时的时间戳
#日志不存在就创建日志
if [ ! -f /tmp/$log ]
then
    echo $t_s2 > /tmp/$log
fi

#下面这段,等同于一个计时器

t_s2=`tail -1 /tmp/$log|awk '{print $1}'`
echo $t_s>>/tmp/$log
v=$[$t_s-$t_s2]   //时间戳对比
echo $v

#当故障存在3600秒,就会进行告警

if [ $v -gt 3600 ]
then
    ../mail/mail.py  "$1"  "$2"  "$3"
    echo "0" > /tmp/$log.txt  //等同于计数器
else
    if [ ! -f /tmp/$log.txt ]
    then
        echo "0" > /tmp/$log.txt
    fi
    nu=`cat /tmp/$log.txt`
    nu2=$[$nu+1]
    echo $nu2>/tmp/$log.txt
    if [ $nu2 -gt 10 ]
    then
         ../mail/mail.py  $1 "trouble continue 10 min $2" "$3"
         echo "0" > /tmp/$log.txt   //邮件告警结束以后,重新开始计数
    fi
fi  

注释:脚本运用于间隔3600秒(1小时)后则再次报次故障信息,通过时间上一次和这一次的时间戳来判断:

注释:核心判断:通过计时器、计数:

 

2、运行告警系统

执行告警系统,肯定要是每分钟,执行一次:

[root@localhost_01 mail]# crontab -e
[root@localhost_01 mail]# cat /var/spool/cron/root 
* * * * * cd /usr/local/sbin/mon/bin ; bahs main.sh
You have mail in /var/spool/mail/root

注释:监控发送邮件的部分,尽量少用空格,因为mail.py发送邮件是以 空格来定义三个参数的:

测试:我们以测试系统负载为例,修改load.sh的负载脚本,当为0时则告警,然后运行sh /usr/local/sbin/mon/bin/main.sh,然后查看邮箱,有邮件过来:

04f9b34b91d006c4dc74e725b42bdea34ef.jpg

注释:mail.py也一次定义多个发件人:如下:

https://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001386832745198026a685614e7462fb57dbf733cc9f3ad000

 

 

转载于:https://my.oschina.net/yuanhaohao/blog/2222506

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值