
监控告警
文章平均质量分 85
监控告警组件的介绍与常见解决方案
Kearey.
这里是我的知识后花园,会利用工作之余将本地笔记更新到优快云博客,关注的朋友请不要取消哦,我超勇的。
展开
-
【监控告警】01-网关的需求与改造
本专题关于监控、告警系列的讨论,是以APISIX网关建设为前提,并结合业务需求展开的。对于 Prometheus、Grafana、Alertmanager ,网上是有大量的基础学习材料的。从部署搭建、到操作使用、再到各种对接扩展。在我整理的学习内容中,大部分是对这些内容按照项目需要进行的重新整理的结果。同时也加入了一些我自己的理解与想法,希望可以帮助到大家。原创 2023-04-21 11:06:08 · 588 阅读 · 2 评论 -
【监控告警】03-Alertmanger的学习之路
Alertmanger作为与Prometheus不可分割的一部分,本着单一性功能的原则,它们的配置都是有上下文关系的。有些Alertmanagerd配置,是基于Prometheus配置的前提下进行的。所以在这个专题中,我会尽量以“假如现在Prometheus的告警规则配置文件中进行了如下配置,那么Alertmanager的配置文件中应该...” 这样的方式进行描述。从全局的角度为大家讲解我在使用过程中的一些心得体会。原创 2023-04-21 15:03:37 · 2583 阅读 · 0 评论 -
【监控告警】02-Promtheus的学习之路
Prometheus 作为一个指标系统天生就不是精确的——由于指标本身就是稀疏采样的,事实上所有的图表和警报都是”估算”,我们也就不必太纠结于图表和警报的对应性,能够帮助我们发现问题解决问题就是一个好监控系统。当然,有时候我们也得证明这个警报确实没问题,那可以看一眼 `ALERTS` 指标。`ALERTS` 是 Prometheus 在警报计算过程中维护的内建指标,它记录每个警报从 Pending 到 Firing 的整个历史过程,拉出来一看也就清楚了。原创 2023-04-21 14:42:46 · 759 阅读 · 0 评论