0. Prometheus总览

最新推荐文章于 2025-01-19 20:14:34 发布

原创最新推荐文章于 2025-01-19 20:14:34 发布 · 204 阅读

0 ·

CC 4.0 BY-SA版权

Prometheus 专栏收录该内容

19 篇文章

订阅专栏

原文:https://prometheus.io/docs/introduction/overview/

什么是Prometheus？
Prometheus是最初在SoundCloud上构建的开源系统监视和告警工具包。自2012年成立以来，许多公司和组织都采用了Prometheus，该项目拥有非常活跃的开发人员和用户社区。现在，它是一个独立的开源项目，并且独立于任何公司进行维护。为了强调这一点并阐明项目的治理结构，Prometheus于2016年加入了Cloud Native Computing Foundation，这是继Kubernetes之后的第二个托管项目。

有关Prometheus的详细说明，请参见媒体部分中的资源链接。

特征
Prometheus的主要特点是：

- 通过度量名称和键值对来识别时间序列数据的多维数据模型
- PromQL，一种灵活的查询语言，可利用此维度
- 不依赖分布式存储；单服务器节点是自治的
- 基于HTTP通过Pull模型进行时间序列收集
- 通过中间网关支持推送时间序列
- 通过服务发现或静态配置发现目标
- 支持多种图形和仪表板模型

组件
Prometheus生态系统包含多个组件，其中许多是可选的：

- Prometheus server ，用于获取并存储时间序列数据
- client libraries，用于检测应用程序代码
- push gateway，用于支持短期工作

Prometheus Pushgateway的存在是为了允许临时任务和批处理作业向Prometheus暴露其指标。
由于某些job存在的时间可能不够长（不能持续提供HTTP服务，所以不能由Prometheus server直接以pull的方式来抓取)
因此可以先将其指标推送到Pushgateway。
然后，Pushgateway将这些指标暴露给Prometheus server，由Prometheus server以pull的方式从Pushgateway拉取数据。

第一步：short-lived jobs -----push---> Push gateway

第二部：prometheus server <----pull----- Push gateway

- 诸如HAProxy，StatsD，Graphite等服务的专用exporters
- alertmanager，用于处理警报
- 各种支持工具
大多数Prometheus组件都是用Go编写的，从而使其易于构建和部署为静态二进制文件。

架构
下图说明了Prometheus的体系结构及其某些生态系统组件：

Prometheus architecture

Prometheus直接或通过用于短期作业的中间推送网关(push gateway)从被检测的job中获取指标。它在本地存储所有抓取的样本，并对这些数据运行规则用以汇总、记录现有数据中的新时间序列，或生成警报。 Grafana或其他API使用者可用于可视化收集的数据。

prometheus优点：

1、部署简单；
2、监控数据的采集可以非常及时，比如对重要指标设置采集间隔为1s或5s，这可以让管理人员快速感知重要故障；

3、很丰富的exporter插件(如haproxy、mysql、memcached、consul）和pushgateway，便于接入各类监控资源；

4、本身基于数学计算模型，大量的实用函数可以实现很复杂规则的业务逻辑监控（例如QPS的曲线弯曲、凸起、下跌的比例等等模糊概念）
5、插件可以嵌入到众多开源软件(如nginx）的内部进行监控，而不是依赖第三方监控agent通过自定义监控项去上报，监控效率更高，数据也更准时可靠。

6、和可视化工具Grafana结合紧密，可以绘制出非常优美的图形。

prometheus缺点：

目前尚不支持集群，如果监控量太大，可能存在性能瓶颈和单点隐患；

Prometheus适合什么？

Prometheus非常适合记录任何纯数字时间序列。它既适合以机器为中心的监控，也适合监控高度动态的面向服务的体系结构。在微服务世界中，它对多维数据收集和查询的支持是特别的优势。

Prometheus的设计旨在提高可靠性，作为中断期间使用的系统，使您能够快速诊断问题。每个Prometheus server都是独立的，而不依赖于网络存储或其他远程服务。当基础结构的其他部分损坏时，您可以依靠它而无需建立广泛的基础结构来使用它。

Prometheus不适合什么？

Prometheus重视可靠性。即使在故障情况下，您也始终可以查看有关系统的可用统计信息。如果您需要100％的准确性（例如按请求计费），则Prometheus并不是一个好选择，因为所收集的数据可能不会足够详细和完整。在这种情况下，最好使用其他系统来收集和分析计费数据，并使用Prometheus进行其余的监控。