Nagios监控系统:告警升级、依赖关系与被动测试详解
1. 告警升级管理
在Nagios监控系统中,当重要组件出现故障,而负责的管理员在规定时间内无法找到解决方案时,Nagios的告警升级功能就发挥作用了。这一功能可以提供多级支持,以应对不同情况。
1.1 短信通知格式
Nagios通过宏 $CONTACTPAGER$ 获取电话号码或别名,由于短信长度不能超过150个字符,所以通知信息会比电子邮件大幅缩写。使用 printf 格式规范 .150 来截断文本,确保短信不超过150字符。例如,短信通知格式如下:
PROBLEM elimail[172.17.130.1]/UPS is CRITICAL /2005-03-30 17:00:53/
Connection refused
1.2 升级机制原理
Nagios的升级机制不是按时间单位计算,而是根据已发送的消息数量。例如,对于 linux01 上的 Database 服务,配置如下:
define service{
host_name linux01
service_description Database
notification_period 24x7
notification_interval 120
...
contac
超级会员免费看
订阅专栏 解锁全文
1149

被折叠的 条评论
为什么被折叠?



