Prometheus 体系貌似已经成为新时代的监控标准,运维出去找工作,很多公司都要求掌握 Prometheus 相关知识。
但是,Prometheus 实际在应用时,通常会遇到一个典型问题:告警规则管理问题。体现为:
想要把 Prometheus 能力开放给全公司各个团队自助服务。但是告警规则需要编写 Yaml 文件,虽然很多公司都已经使用 Git 来管理这些规则,但是仍然需要运维团队来统一 Code Review 之后才能 Merge 进主干,因为担心某个人提交规则时,影响了其他人的规则。甚至有些公司是:研发团队给运维团队提工单,由运维团队统一维护管理这些告警规则。这着实有些痛苦。效率也太低。
有痛苦必有解法。今天为大家介绍一个开源项目,就是来解决这个问题的,它的名字是:Nightingale,即夜莺监控。

夜莺监控可以充当 Prometheus 的告警引擎,用户可以在 Nightingale 的 UI 中管理告警规则,UI 有权限控制,不同的规则相互之间没有影响。而且:
- 夜莺的告警引擎是高可用的,可以部署多个夜莺进程组成集群,某个节点挂了,整体告警功能不受影响
- 夜莺不但可以对 Prometheus 时序数据做告警,也可以对 VictoriaMetrics、Thanos、Mimir 等其他时序库告警,也可以对 ElasticSearch、Loki 告警,也可以对 ClickHouse、MySQL、Postgres 等其他存储的数据做告警
夜莺项目相关地址:

最低0.47元/天 解锁文章
8619

被折叠的 条评论
为什么被折叠?



