FLINK反压分析

最新推荐文章于 2025-10-22 13:52:39 发布

原创最新推荐文章于 2025-10-22 13:52:39 发布 · 449 阅读

CC 4.0 BY-SA版权

文章标签：

测试反压可以快速的定位流处理系统的性能瓶颈所在。先在Kafka中积攒一批数据，然后在使用Flink消费，就好比水库泄洪，很容易找到下游性能薄弱的环节。

反压的原因可能会有：

定位之前禁用掉OperatorChain，这样原本chain到一起的多个算子会分开，方便我们更精细的定位性能瓶颈。

找到反压算子之后，我们可以使用Flame Graph火焰图，来分析每个方法调用的耗时，从而找到耗时较长的方法。

开启火焰图的方法：

在flink-conf.yaml中配置。

参数	默认值	含义
rest.flamegraph.enabled	false	是否开启火焰图
rest.flamegraph.cleanup-interval	10min	统计信息的缓存清除时间
rest.flamegraph.delay-between-samples	50 ms	构建 FlameGraph 的单个堆栈跟踪样本之间的延迟
rest.flamegraph.num-samples	100	构建flamegraph的采样数
rest.flamegraph.refresh-interval	1 min	火焰图刷新的时间间隔
rest.flamegraph.stack-depth	100	创建FlameGraphs 的堆栈跟踪的最大深度