监控告警
文章平均质量分 94
要做一个小太阳
爱捡破烂的小女孩
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
负载监控告警怎么设置更合理
方面评价说明思路✅ 正确标准化负载是正确的方法计算⚠️ 需优化可以去掉阈值⚠️ 需调整1.5 可能偏高,建议 1.0-1.2。原创 2025-12-02 16:52:24 · 791 阅读 · 0 评论 -
告警 Fingerprint 生成规则
告警 Fingerprint 生成规则摘要 Fingerprint 是 Prometheus Alertmanager 中用于唯一标识告警的哈希值,基于告警标签生成,主要实现告警去重和状态跟踪。原创 2025-11-28 16:06:51 · 896 阅读 · 0 评论 -
无法采集node_ntp指标怎么监控ntp服务状态
使用 DaemonSet 部署 node-exporter 时,无法采集 node_ntp 指标数据, 整体排查思路原创 2025-11-27 20:27:10 · 543 阅读 · 0 评论 -
如何检测和监控ntpd服务down
摘要: 本文详细介绍了检测和监控NTP服务(ntpd)异常的方法。通过四个维度(进程状态、端口监听、时间同步状态、日志告警)进行综合判断,包括使用systemctl检查服务状态、ntpq验证同步状态、ss检查端口监听以及日志监控等。还提供了自动化脚本示例和基于Prometheus的监控方案,包括node_exporter配置、关键指标说明和告警规则建议。最后给出了systemd服务的完整配置示例,帮助实现NTP服务的持续监控和告警。原创 2025-11-27 19:09:39 · 899 阅读 · 0 评论
分享