- 博客(8)
- 收藏
- 关注
原创 alertmanager webhook json format
Alertmanager是一个强大的警报管理工具,可以通过Webhook发送警报通知。Webhook是一种HTTP回调机制,允许在发生某些事件时将数据推送到指定的URL。Alertmanager可以通过Webhook将警报数据发送到各种第三方服务,例如Slack、PagerDuty和Email等。当Alertmanager发送Webhook请求时,它将POST请求的正文设置为一个JSON格式的字符串。该JSON对象包含了警报的所有信息,如标签、注释、摘要、级别和状态等。
2024-11-05 17:04:59
608
原创 打造云原生大型分布式监控系统(四): Kvass+Thanos 监控超大规模容器集群
继上一篇Thanos 部署与实践发布半年多之后,随着技术的发展,本系列又迎来了一次更新。本文将介绍如何结合 Kvass 与 Thanos,来更好的实现大规模容器集群场景下的监控。
2024-11-05 15:48:41
406
原创 使用NGINX作为HTTPS正向代理服务器
NGINX主要设计作为反向代理服务器,但随着NGINX的发展,它同样能作为正向代理的选项之一。正向代理本身并不复杂,而如何代理加密的HTTPS流量是正向代理需要解决的主要问题。本文将介绍利用NGINX来正向代理HTTPS流量两种方案,及其使用场景和主要问题。作者:怀知NGINX主要设计作为反向代理服务器,但随着NGINX的发展,它同样能作为正向代理的选项之一。正向代理本身并不复杂,而如何代理加密的HTTPS流量是正向代理需要解决的主要问题。
2024-11-05 15:45:11
668
原创 视频|打造云原生大型分布式监控系统(三): Thanos 部署与实践
视频附上本系列文章的所有视频打造云原生大型分布式监控系统(一): 大规模场景下 Prometheus 的优化手段视频地址https://mp.weixin.qq.com/s?__biz=Mzg5NjA1MjkxNw==&mid=2247483913&idx=1&sn=b58e6bb6e6871901e57f0c9bd00917a9&chksm=c007b9d3f77030c56f18cff0ee381b6b0fa85cfffcdbb87e076930d362be5
2024-11-05 15:31:48
1069
原创 打造云原生大型分布式监控系统(二): Thanos 架构详解
在上一篇文章,我们想尽 “千方百计” 才好不容易把 Prometheus 优化到适配大规模场景,部署和后期维护麻烦且复杂不说,还有很多不完美的地方,并且还无法满足一些更高级的诉求,比如查看时间久远的监控数据,对于一些时间久远不常用的 “冷数据”,最理想的方式就是存到廉价的对象存储中,等需要查询的时候能够自动加载出来。Thanos (没错,就是灭霸) 可以帮我们简化分布式 Prometheus 的部署与管理,并提供了一些的高级特性:全局视图,长期存储,高可用。下面我们来详细讲解一下。
2024-11-05 15:23:56
588
原创 打造云原生大型分布式监控系统(一): 大规模场景下 Prometheus 的优化手段
Prometheus 几乎已成为监控领域的事实标准,它自带高效的时序数据库存储,可以让单台 Prometheus 能够高效的处理大量的数据,还有友好并且强大的 PromQL 语法,可以用来灵活的查询各种监控数据以及配置告警规则,同时它的 pull 模型指标采集方式被广泛采纳,非常多的应用都实现了 Prometheus 的 metrics 接口以暴露自身各项数据指标让 Prometheus 去采集,很多没有适配的应用也会有第三方 exporter 帮它去适配 Prometheus,所以监控系统我们通常首选用
2024-11-05 15:18:45
1120
原创 安全的移除Es数据节点步骤
说明:想要安全的移除一个es节点,不改变分片的数量,100%不会引起数据丢失,即保证这个节点的所有数据被其他节点接收。然后停止这个节点的实例。2.若出现pening_tasks,当pending_tasks的等级>=HIGH时,存在集群无法新建索引的风险。3.若集群中出现UNASSIGNED shards,检查原因,查看是否是分配策略导致无法迁移分片。4.查看节点数据是否已迁移,都是 0 表示数据也已经迁移。步骤1:将节点从集群路由策略中排除。步骤2:等待节点上分片全部被迁移。步骤4:取消节点禁用策略。
2024-11-05 15:14:14
582
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人