深入探索 Prometheus 与 Thanos 生态系统
1. Thanos 规则组件介绍
Thanos rule 组件允许针对远程查询端点(如 Thanos querier 或 sidecar)运行与 Prometheus 兼容的规则(记录/警报)。它会暴露一个 StoreAPI 端点,使规则评估的结果可被获取。这些结果存储在本地块中,并且还能将这些 TSDB 块发送到对象存储。
有人可能会想使用这个组件来集中管理规则,而不是将规则分散在多个 Prometheus 实例中,但这并非其设计目的,而且不建议这样做。因为规则,尤其是用于警报的规则非常关键,应在拥有所需指标的 Prometheus 实例本地运行这些规则。使用 Thanos ruler 进行警报会在关键路径上增加多个故障点,包括其他 Thanos 组件、网络,最坏的情况下还有对象存储。警报需要具有可预测性和可靠性,所以对于大多数警报需求,不应考虑使用 Thanos ruler。不过,了解它的存在仍很重要。更多关于 Thanos ruler 的信息可查看: https://thanos.io/components/rule.md 。
2. Prometheus 与 Thanos 生态系统概述
2.1 远程读写端点
我们了解到基于预写日志(WAL)的远程写入策略对 Prometheus 的全局性能和可用性至关重要。这种策略有助于提高数据写入的效率和可靠性,确保数据在写入过程中不会丢失。
超级会员免费看
订阅专栏 解锁全文
1190

被折叠的 条评论
为什么被折叠?



