前言
本专题关于监控、告警系列的讨论,是以APISIX网关建设为前提,并结合业务需求展开的。
详情可以回顾:【网关建设】01-APISIX实战之概要设计
对于 Prometheus、Grafana、Alertmanager ,网上是有大量的基础学习材料的。
从部署搭建、到操作使用、再到各种对接扩展。
在我整理的学习内容中,大部分是对这些内容按照项目需要进行的重新整理的结果。同时也加入了一些我自己的理解与想法,希望可以帮助到大家。
APISIX对接Prometheus
整体的设计流程图如下所示:
通过APISIX与Prometheus、Grafana、Alertmanager的对接
实现对业务平台的监控、告警功能,并对监控内容提供接口支持,获取监控信息。
调用内部的邮件短信接口,在告警发生时推送邮件短信。

apisix-监控告警
监控告警的业务改造
其中的花费了一些时间的内容在于:
1. 对于对接到APISIX的服务,需要提供额外的监控指标,包含:异常率、异常次数、访问次数、处理时间 。这些监控指标原生的APISIX并没有提供,需要再其提供的基础metric上,对数据进行二次加工。
2. 需要通过webhook的方式,将告警信息传递到业务平台,在业务平台实现对告警记录的实时查看,这中间涉及到了告警路由的问题。
3. 支持通过API的方式,返回监控指标的查询结果
详细涉及到的监控告警的内容,可以参考:
以上就是帖子的全部内容啦,关注我,我会定期更新,期待与你的共同进步!
