Grafana+Prometheus监控Flink on YARN系统搭建

1.简介
Flink支持多种监控指标的汇报reporter,例如jmx、slf4j、Prometheus、InfluxDB等。
Grafana+Prometheus是当前比较流行的监控可视化解决方案。如下图为Prometheus及相关组件组成的生态系统。
在这里插入图片描述
2.安装配置
Prometheus是采用拉模式的方式,从exporter拉取监控的数据。但Prometheus自动发现Flink on YARN作业的提交、结束以及自动拉取数据是比较困难的。PushGateway作为一个中转组件,通过配置Flink on YARN作业将监控指标推到PushGateway,Prometheus再从PushGateway拉取数据。
(1)首先拷贝监控用的jar包Flink的lib目录下
将flink的opt目录下面的flink-metrics-prometheus-1.7.2.jar包拷贝到flink的lib下:

cd /opt/flink-1.7.2
cp opt/flink-metrics-prometheus-1.7.2.jar lib

(2)Prometheus和PushGateway组件下载地址为:

https://github.com/prometheus/prometheus/releases/download/v2.12.0/prometheus-2.12.0.linux-amd64.tar.gz
https://github.com/prometheus/pushgateway/releases/download/v0.9.1/pushgateway-0.9.1.linux-amd64.tar.gz

(3)解压文件,并修改
Prometheus的配置文件prometheus.yml添加配置如下图;
Prometheus的默认端口是9090,PushGateway的默认端口是9091。

  - job_name: 'flink'
    file_sd_configs:
     - files:
       - configs/flink.json

configs/flink.json的配置如下图:

[
 {
  "targets": ["172.30.11.15:9091"]
 }
]

(4)启动PushGateway和Prometheus。

nohup ./pushgateway --web.listen-address :9091 > /var/log/pushgateway.log 2>&1 &
nohup ./prometheus --config.file=prometheus.yml > /var/log/prometheus.log 2>&1 &

若Prometheus为生产环境热启动,只需要在服务器上执行如下命令即可:

curl -X POST http://172.30.11.15:9090/-/reload

(5)编辑flink-conf.yaml,添加Flink与PushGateway集成的参数

metrics.reporter.promgateway.class: org.apache.flink.metrics.prometheus.PrometheusPushGatewayReporter
# 这里写PushGateway的主机名与端口号
metrics.reporter.promgateway.host: 172.30.11.15
metrics.reporter.promgateway.port: 9091
# Flink metric在前端展示的标签(前缀)与随机后缀
metrics.reporter.promgateway.jobName: flink-metrics-ppg
metrics.reporter.promgateway.randomJobNameSuffix: true
metrics.reporter.promgateway.deleteOnShutdown: false

(6)配置grafana
Grafana默认端口:3000,点击Create your first data source添加Prometheus数据源。如下图所示:
在这里插入图片描述
(7)启动flink
(8)添加监控图表
点击New Dashboard->Add Query按钮,即可看到Flink下的监控指标。
在这里插入图片描述
选好监控指标,就可以从图表中看到监控数据的折线了。

### 配置 PrometheusGrafana 实现 Flink监控 #### 安装与配置 Prometheus 为了实现对 Flink 的有效监控Prometheus 是核心组件之一。由于 Flink on YARN 作业的动态特性,直接由 Prometheus 抓取数据存在挑战。因此引入了 PushGateway 中间件来解决这一问题。 - **安装 Prometheus** 下载并解压官方提供的二进制文件即可完成安装过程[^1]。 - **配置 Prometheus** 编辑 `prometheus.yml` 文件,在 scrape_configs 节点下添加针对 PushGateway 数据源的抓取规则: ```yaml scrape_configs: - job_name: 'pushgateway' static_configs: - targets: ['localhost:9091'] ``` 此设置使得 Prometheus 可以定期从指定地址获取推送过来的数据。 #### 使用 PushGateway 收集临时性度量指标 对于像 Flink 这样的批处理或流处理框架来说,其任务可能具有短暂生命周期的特点。此时可以通过修改 Flink 应用程序代码,使其能够向 PushGateway 发送自定义 Metrics;或者利用 Flink 提供的内置 Metric Reporter 功能指向 PushGateway 地址。 当应用程序结束运行之后,这些短期存在的 Metrics 不会立即消失而是继续存在于 PushGateway 上等待被采集[^3]。 #### 安装与配置 Grafana Grafana 主要用于可视化展示收集到的各种性能指标信息。 - **下载与启动 Grafana** 访问镜像站点加速下载速度,并按照常规方式启动服务进程[^2]: ```bash nohup ./bin/grafana-server web & ``` 默认情况下监听于本地 3000 端口上提供 Web UI 接入支持,默认用户名密码均为 admin。 - **连接至 Prometheus 数据源** 登录后进入 Data Sources 页面新增一个名为 "Prometheus" 类型的选择项,填入之前部署好的 Prometheus Server URL 即可建立关联关系。 - **创建仪表板** 导入预先设计好适用于 Flink 监控场景下的模板化面板布局方案(例如 ID 为 11049),这样就能快速获得一组合理的视图组合来进行日常运维管理操作了。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

jiedaodezhuti

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值