1, 指标配置的问题:
1)、如果指标是类似于“成功率”、“利用率”等百分比越高,性能越好的来说:
基线值设置为类似于100—98,当小于98时,发送告警短信。此时设置下容忍度:
2)、如果指标是类似于“失败率”、“掉线率”等百分比越低,性能越好的来说:
基线值设置为类似于0.1---0,当大于0.1时,发送告警短信。此时设置上容忍度:
3)、配置指标维度的网元为地市时,
4)、配置指标维度的网元为其他设备类型时:
2,冗余数据太多,由于可能新建指标后,又在页面上删除,但是数据库中由于关联表太多,有可能数据没有删除干净,导致定时扫描程序扫描出冗余数据。
可尝试删除下列表中数据:
1》 可以全部删除(慎用)
select * from c_alert_originalid
SELECT * FROM c_alert_active
select * FROM c_alert_clearing
select * from c_alert_clearing_update
select * from c_alert_adding
select * from c_alert_sendhistory
select * from c_alert_history
2》----此处只删除与冗余数据相关的
select * from c_table_dimension
where fc_tableid='2011218154944'
SELECT * FROM c_baslinedefine_dimension
where 1=1
and fc_baslineid='201132114391669'
3,如果日志太大,注意清理一下(不影响短信发送)
/u1/tmn/kpi_appnew/kpiengine/domain10
/u1/tmn/kpi_appnew/kpiengine/web/zhibiao/WEB-INF/lib
>nohup.out
4,如果很长时间没有重启定时程序,也可能影响短信发送:
root@sdunicomh # pwd
/u1/tmn/kpi_appnew/kpiengine/web/zhibiao/WEB-INF/lib
root@sdunicomh # ps -ef|grep SquarzServer
root 19843 18335 0 13:25:35 pts/3 0:00 grep SquarzServer
root 19841 18335 0 13:25:06 pts/3 0:00 sh ./SquarzServer.sh
root@sdunicomh # kill -9 19841
root@sdunicomh # ps -ef|grep SocketServer
root 19839 18335 0 13:25:02 pts/3 0:00 sh ./SocketServer.sh
root 19846 18335 0 13:25:49 pts/3 0:00 grep SocketServer
root@sdunicomh # kill -9 19839