多领域网格网络监控告警服务与Grid Anywhere架构解析
1. 多领域网格网络监控告警服务
1.1 告警规则示例
以接口拥塞告警规则为例:
rule "Interface Congestion"
when
A router has output drops > "0" but utilisation is < "80" percent
then
Log : "Router has output drops"
Raise InterfaceCongestionAlarm
end
此规则表明,当路由器输出丢包数大于0且利用率低于80%时,记录日志并触发接口拥塞告警。
1.2 告警引擎工作流程
告警引擎按用户定义的时间间隔触发对所有配置的测量代理(MA)的查询,具体步骤如下:
1. 为每个测量主题和指标构建查询,并发送给相关的MA。
2. 通过NM - WG Web服务接口检索监控数据。
3. 将数据打包到内部数据容器中。
4. 在当前状态分析器中,将容器中的数据与用户配置的告警规则进行比较。
5. 若测量数据满足规则条件,激活该规则,编译相关数据(主题、指标、告警条件)并转发给告警分析器。
6. 告警分析器将触发的告警与相关主题的历史记录进行比较,决定是否通过状态通知触发告警。若告警条件不再满足,则重置告警。
1.3 状态通知
状态通知机制可接入不同的通知方法,如发送电子邮件、实现SNMP陷阱、写入Web界面或集成网络气象图系统等。该接口