自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 alertmanager webhook json format

Alertmanager是一个强大的警报管理工具,可以通过Webhook发送警报通知。Webhook是一种HTTP回调机制,允许在发生某些事件时将数据推送到指定的URL。Alertmanager可以通过Webhook将警报数据发送到各种第三方服务,例如Slack、PagerDuty和Email等。当Alertmanager发送Webhook请求时,它将POST请求的正文设置为一个JSON格式的字符串。该JSON对象包含了警报的所有信息,如标签、注释、摘要、级别和状态等。

2024-11-05 17:04:59 608

原创 打造云原生大型分布式监控系统(四): Kvass+Thanos 监控超大规模容器集群

继上一篇Thanos 部署与实践发布半年多之后,随着技术的发展,本系列又迎来了一次更新。本文将介绍如何结合 Kvass 与 Thanos,来更好的实现大规模容器集群场景下的监控。

2024-11-05 15:48:41 406

原创 使用NGINX作为HTTPS正向代理服务器

NGINX主要设计作为反向代理服务器,但随着NGINX的发展,它同样能作为正向代理的选项之一。正向代理本身并不复杂,而如何代理加密的HTTPS流量是正向代理需要解决的主要问题。本文将介绍利用NGINX来正向代理HTTPS流量两种方案,及其使用场景和主要问题。作者:怀知NGINX主要设计作为反向代理服务器,但随着NGINX的发展,它同样能作为正向代理的选项之一。正向代理本身并不复杂,而如何代理加密的HTTPS流量是正向代理需要解决的主要问题。

2024-11-05 15:45:11 668

原创 告警规则参考

【代码】告警规则参考。

2024-11-05 15:40:28 289

原创 视频|打造云原生大型分布式监控系统(三): Thanos 部署与实践

视频附上本系列文章的所有视频打造云原生大型分布式监控系统(一): 大规模场景下 Prometheus 的优化手段视频地址https://mp.weixin.qq.com/s?__biz=Mzg5NjA1MjkxNw==&mid=2247483913&idx=1&sn=b58e6bb6e6871901e57f0c9bd00917a9&chksm=c007b9d3f77030c56f18cff0ee381b6b0fa85cfffcdbb87e076930d362be5

2024-11-05 15:31:48 1069

原创 打造云原生大型分布式监控系统(二): Thanos 架构详解

在上一篇文章,我们想尽 “千方百计” 才好不容易把 Prometheus 优化到适配大规模场景,部署和后期维护麻烦且复杂不说,还有很多不完美的地方,并且还无法满足一些更高级的诉求,比如查看时间久远的监控数据,对于一些时间久远不常用的 “冷数据”,最理想的方式就是存到廉价的对象存储中,等需要查询的时候能够自动加载出来。Thanos (没错,就是灭霸) 可以帮我们简化分布式 Prometheus 的部署与管理,并提供了一些的高级特性:全局视图,长期存储,高可用。下面我们来详细讲解一下。

2024-11-05 15:23:56 588

原创 打造云原生大型分布式监控系统(一): 大规模场景下 Prometheus 的优化手段

Prometheus 几乎已成为监控领域的事实标准,它自带高效的时序数据库存储,可以让单台 Prometheus 能够高效的处理大量的数据,还有友好并且强大的 PromQL 语法,可以用来灵活的查询各种监控数据以及配置告警规则,同时它的 pull 模型指标采集方式被广泛采纳,非常多的应用都实现了 Prometheus 的 metrics 接口以暴露自身各项数据指标让 Prometheus 去采集,很多没有适配的应用也会有第三方 exporter 帮它去适配 Prometheus,所以监控系统我们通常首选用

2024-11-05 15:18:45 1120

原创 安全的移除Es数据节点步骤

说明:想要安全的移除一个es节点,不改变分片的数量,100%不会引起数据丢失,即保证这个节点的所有数据被其他节点接收。然后停止这个节点的实例。2.若出现pening_tasks,当pending_tasks的等级>=HIGH时,存在集群无法新建索引的风险。3.若集群中出现UNASSIGNED shards,检查原因,查看是否是分配策略导致无法迁移分片。4.查看节点数据是否已迁移,都是 0 表示数据也已经迁移。步骤1:将节点从集群路由策略中排除。步骤2:等待节点上分片全部被迁移。步骤4:取消节点禁用策略。

2024-11-05 15:14:14 582

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除