Flink 通过 paimon 关联维表，内存降为原来的1/4

最新推荐文章于 2025-01-14 11:33:31 发布

原创

最新推荐文章于 2025-01-14 11:33:31 发布 · 804 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#flink #python #linux

了解大厂经验
拥有和大厂相匹配的技术等

希望看什么，评论或者私信告诉我！

一、前言

线上实时任务，通过 FlinkSQL 关联 Iceberg 维表，维表大搞有 60w，首先通过 FlinkSQL关联 Iceberg 维表上线了，经过一番调优后：TaskManager Memory 给到了 16G，但通过监控可以轻易的发现 Heap 没下来过 10GB

图片.png

二、优化

2.1 分析 Iceberg lookup 部分源码

因为 Iceberg 的 lookup 是公司内部自己实现的，就不贴源码了，但核心一点就是，look up 维表 cache 的数据会存在内存中，这就是为什么堆内存没有下来过 10GB

2.2 切换到 paimon 维表

TaskManager Memory 给到了 4G，程序运行的轻轻松松，另外为了增加 rocksdb 性能，也适当的增加了 rocksdb 的内存

图片.png

为了替换 paimon 后内存可以下降那么多呢？

2.3 paimon 维表原理分析

首先来看一下 FlinkSQL look up paimon 的维表的源码，这里我们以 flink1.15 为例。下载完 paimon 源码后，找到 moudle paimon-flink-1.15

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

「已注销」

关注关注

15
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

apache paimon在flink中做维表join的优势

yy的博客

06-05

1213

下载源码自己看下有些错的请帮忙提示我# 核心参数- AUTO //默认值- Auto mode, try to use partial mode. //部分更新模式.- FULL- Use full caching mode //rocksdb存全量,可规避常规look up join的缓存穿透# 维表join 入口分类逻辑 PrimaryKeyPartialLookupTable|PrimaryKeyLookupTable 的 open。

优化 Apache Flink 中的维表 Join 策略：探索最佳实践和技巧

数据与算法架构提升之路专栏

01-12

1970

总体来讲，关联维表有六个基础的方式：（1）查找外部数据源关联（2）预加载维表关联（内存，状态）（3）冷热数据储备（算是1和2的结合使用）（4）维表变更日志关联（广播也好，其他方式的流关联也好）（5）Temporal Table Join （6）Lookup Table Join

参与评论您还未登录，请先登录后发表或查看评论

Apache Flink 维表关联实战.pdf

08-18

Apache Flink 维表关联实战.pd

Flink 维表关联

qianyulin

10-24

875

但是，当我们的流计算数据过大，会对外部系统带来巨大的访问压力，一旦出现比如连接失败、线程池满等情况，由于我们是同步调用，所以一般会导致线程阻塞、Task 等待数据返回，影响整体任务的吞吐量。利用 Flink 的 RichAsyncFunction 读取 mysql 的数据到缓存中，我们在关联维度表时先去查询缓存，如果缓存中不存在这条数据，就利用客户端去查询 mysql，然后插入到缓存中。

Flink 维表关联方案

猫猫爱吃小鱼粮

01-03

2706

Flink 维表关联方案

【Flink系列】开发篇：1. Flink维表关联方案

m0_37935211的博客

01-12

2744

谈一谈个人对Flink中不同维表关联方案的理解和尝试后发现的一些问题

Flink+Paimon实时数据湖仓实践分享

淘系技术

12-06

2863

随着 Paimon 近两年的推广普及，使用 Flink+Paimon 构建数据湖仓的实践也越来越多。在 Flink 实时数据开发中，对于依赖大量状态 state的场景，如长周期的累加指标计算、回撤长历史数据并更新等，使用实时数仓作为中间存储来代替 Flink 的内部状态 state 是非常有必要的。本文主要分享了使用 Paimon 作为实时状态存储，并在 Flink 中通过 Lookup 维表 ...

一图读懂：Flink CDC如何流式写入Paimon？

weixin_47467016的博客

06-04

1004

Flink Stream Write 整体流程

Flink DataStream 关联维表实战

weixin_41608066的博客

03-03

689

上篇博客提到 Flink SQL 如何 Join 两个数据流，有读者反馈说如果不打算用 SQL 或者想自己实现底层操作，那么如何基于 DataStream API 来关联维表呢？实际上由于 Flink DataStream API 的灵活性，实现这个需求的方式是非常多样的，但是大部分用户很难在设计架构时就考虑得很全面，可能会走不少弯路。针对于此，笔者根据工作经验以及社区资源整理了用 DataSt...

中电金信：技术实践｜Flink维度表关联方案解析

zhongdianjinxin的博客

03-15

1376

实时lookup数据库关联的特点是实现简单，但数据库压力较大，无法支撑大数据量的维度数据查询，并且在查询时只能根据当时的维度表数据查询，如果事实表数据重放或延迟，查询结果的正确性无法得到保证，且多次查询结果可能不一致。广播维度表方案是将维度表数据用流的方式接入Flink Job 程序，并将维度表数据进行广播，再与事件流数据进行关联，此种方式可以及时获取维度表的数据变更，但因数据保存在内存中，因此支持的维度表数据量较小。每条事实表数据都会根据关联键，到存储维度表的数据库中查询一次。

轻松通关Flink第19讲：Flink 如何做维表关联

sucaiwa的博客

03-28

2338

这一课时我们讲解了 Flink 关联维度表的几种常见方式，分别介绍了它们的优劣和适用场景，并进行了代码实现。我们在实际生产中应该从业务本身出发来评估每种方案的优劣，从而达到维表关联在时效性和性能上达到最优。点击这里下载本课程源码。

【Flink SQL API体验数据湖格式之paimon】

以茉萱的博客

12-24

1826

随着大数据技术的普及，数据仓库的部署方式也在发生着改变，之前在部署数据仓库项目时，首先想到的是选择国外哪家公司的产品，比如：数据存储会从Oracle、SqlServer中或者Mysql中选择，ETL工具会从Informatica、DataStage或者Kettle中选择，BI报表工具会从IBM cognos、Sap Bo或者帆软中选择，基本上使用的产品组合都类似，但随着数据量的激增，之前的部署方式已经越来越不能满足业务场景，例如：不同格式的数据存储，传出的数据库无法存储，而且随着数量的增多，数据库的响应速度

Paimon实战 -- paimon原理解析

阿华田的博客

08-16

3331

Apache Paimon 原名 Flink Table Store，2022年1月在 Apache Flink 社区从零开始研发，Flink 社区希望能够将 Flink 的 Streaming 实时计算能力和 Lakehouse 新架构优势进一步结合，促进数据在数据湖上真正实时流动起来，并为用户提供实时离线一体化的开发体验。

（二十）Flink Paimon

springk的专栏

08-26

909

数据湖、湖仓一体是当前大数据领域发展的重要趋势。近几年开源数据湖如Apache Hudi、Apache Iceberg、Apache Paimon、DeltaLake等不断涌现，基于湖仓一体架构的统一元数据管理、数据治理也越来越受到关注。从传统数仓到数据湖、湖仓一体架构，从流批一体计算到基于数据湖的流批一体存储，越来越多的企业基于开源技术，在集成、计算、存储、查询分析等方面不断优化，形成适合自身业务发展的湖仓平台。本章我们将介绍Apache Paimon的概念以及 Flink Paimon 的实现方式。

Flink 数据写入 Paimon 流程及源码解析

Ververica的博客

08-14

1083

作者介绍：王伟骏，花名（鸿历），2016 年硕士毕业于南京邮电大学，目前就职于阿里巴巴智能引擎事业部，长期从事大数据开发相关工作。01背景在阿里集团数据湖计划的大背景下，入湖作为数据链路的第一环非常重要。本文对 Flink 流 / 批 Job 写数据进 Paimon 主键表的源码进行了深入浅出的总结，后续会持续更新 Paimon 别的模块的解读。02写入 Paimon 表组合方式表类型：Prima...

【Apache Paimon】-- 源码解读之环境问题

欢迎来到我的博客，一起探索代码里的世界！

01-14

468

确保 ANTLR 的语法文件正确生成了JavaParser和JavaLexer。确认 ANTLR 运行时依赖已包含在项目中。检查包路径是否一致。确认 IDE 和构建工具配置无误。

flink+paimon默认读取

sinat_35197112的博客

09-03

260

flink+paimon的生成机制

基于 Flink SQL 和 Paimon 构建流式湖仓新方案

数据与算法架构提升之路专栏

12-22

2308

Paimon 结合了湖存储和 LSM（Log Structured MergeTree）技术，提供了低延时、低成本的流式数据湖解决方案。 Paimon 与 Flink 有深度集成，支持 CDC

flink 流读paimon实时表 join 每天读一次paimon天分区表

最新发布

07-15

<think>我们正在处理一个Flink流处理任务，需要读取一个实时更新的Paimon表（例如实时订单流），并与一个每天更新一次的分区表（例如每日更新的商品维度表）进行Join操作。关键点在于如何高效地关联实时流和每日批量更新的维表。解决方案核心思路： 1. **实时表（事实表）**：使用流模式读取，每条记录都会触发处理。 2. **每日分区表（维表）**：由于每天更新一次，我们可以将其视为一个缓慢变化的维表。在Flink中，我们可以使用Lookup Join，并配置合理的缓存策略以减少对底层存储的访问。具体步骤： ### 1. 创建实时表（事实表）假设实时表为`orders_realtime`，包含订单的实时信息，其中`proc_time`是处理时间属性，用于Lookup Join。 ```sql CREATE TABLE orders_realtime ( order_id STRING, product_id INT, order_time TIMESTAMP(3), proc_time AS PROCTIME() -- 处理时间属性，用于Lookup Join ) WITH ( 'connector' = 'paimon', 'path' = 'hdfs://path/to/realtime_orders', 'scan.mode' = 'latest' -- 实时读取最新数据 ); ``` ### 2. 创建每日分区表（维表）假设每日分区表为`product_daily`，按天分区，每天批量更新一次。注意，我们需要设置分区时间提取器和刷新间隔。 ```sql CREATE TABLE product_daily ( product_id INT, product_name STRING, price DECIMAL(10, 2), dt STRING -- 分区字段，格式为'yyyy-MM-dd' ) WITH ( 'connector' = 'paimon', 'path' = 'hdfs://path/to/product_daily', 'partition.expiration-time' = '7 d', -- 可选：分区过期策略 'partition.timestamp-formatter' = 'yyyy-MM-dd', 'partition.timestamp-pattern' = '$dt', 'continuous.discovery-interval' = '1 d' -- 每天检查一次分区更新 ); ``` ### 3. 执行Lookup Join 使用处理时间（`proc_time`）进行Lookup Join，确保每个实时订单记录关联的是当前时刻维表的最新版本（即最新分区）。 ```sql SELECT o.order_id, o.product_id, p.product_name, p.price, o.order_time FROM orders_realtime AS o JOIN product_daily FOR SYSTEM_TIME AS OF o.proc_time AS p ON o.product_id = p.product_id; ``` ### 4. 维表缓存优化由于维表每天更新一次，我们可以使用全量缓存（FULL）策略，避免频繁访问底层存储。在维表配置中添加Lookup Cache参数： ```sql CREATE TABLE product_daily ( ... ) WITH ( ... -- Lookup Cache配置 'lookup.cache-type' = 'FULL', -- 全量缓存，适用于更新频率低的维表 'lookup.cache-ttl' = '24 h', -- 缓存24小时，与分区更新频率一致 'lookup.async' = 'true' -- 异步查询 ); ``` 说明： - `lookup.cache-type='FULL'`：将整个维表加载到内存中，适用于小维表（内存足够）且更新不频繁的场景。 - `lookup.cache-ttl='24 h'`：缓存24小时，每天自动刷新一次（配合`continuous.discovery-interval`）。 - `lookup.async='true'`：异步查询，避免阻塞主处理线程。 ### 5. 分区更新机制 Paimon的分区表在添加新分区（如新一天的数据）后，Flink作业如何感知？ - 通过`continuous.discovery-interval`参数控制分区发现的间隔（这里设为1天）。当新分区被检测到时，Lookup Cache会在下一次访问时重新加载全量数据（如果缓存过期）。注意：缓存刷新是在下次访问时触发，因此`cache-ttl`应设置得大于等于分区更新间隔，以确保在刷新前缓存不会失效。 ### 6. 流批一体下的特殊处理如果实时表也是分区表（例如按小时分区），而维表按天分区，则可能需要动态关联分区路径。但Paimon的Lookup Join会自动处理分区过滤，只需确保维表的分区字段在Join条件中正确使用（这里我们使用`product_id`作为Join键，分区字段`dt`不直接参与Join，但维表的最新分区数据会包含所有商品的最新信息）。如果维表的分区是按天，且每天的分区包含当天的完整维度快照，那么上述Join操作会关联到维表最新分区的数据（即当天数据）。 ### 7. 性能注意事项 - **维表大小**：如果维表很大（例如上亿条），全量缓存可能消耗大量内存，需谨慎使用。可考虑： - 使用`'lookup.cache-type'='PARTIAL'`，并调整`cache-max-rows`和`cache-ttl`。 - 增加内存资源。 - **缓存刷新延迟**：新分区加入后，缓存不会立即刷新，而是等到缓存过期或下次访问时触发。如果需要更及时的刷新，可缩短`cache-ttl`（但不宜过短，否则失去缓存意义）。 ### 8. 监控与调优通过Flink Metrics监控缓存命中率： - `hitCacheCount`：命中缓存的次数 - `totalCount`：总查询次数 - 命中率 = hitCacheCount / totalCount 目标：保持高命中率（>95%），若过低则需检查缓存配置或维表更新是否过于频繁。相关问题： §§相关问题§§ 1. 如何确保Paimon维表的分区更新后，Flink Lookup Join能及时获取新数据？ 2. 当维表数据量过大无法全量缓存时，应该采用什么策略优化Lookup Join？ 3. 在流处理中，如何监控Paimon Lookup Join的性能指标？ 4. 如果实时表与维表的分区时间不同步，应该如何处理？</think>### Flink 流处理中读取 Paimon 实时表关联每日分区表的解决方案在 Flink 流处理中实现实时表与每日分区表的 Join，需结合 **流表动态关联分区表** 和 **Lookup Join 优化**。以下是完整实现方案： --- #### 1. 表定义与关键配置 ##### (1) 实时流表（事实表） ```sql CREATE TABLE orders_realtime ( order_id STRING, product_id INT, order_time TIMESTAMP(3), proc_time AS PROCTIME() -- 处理时间属性，用于 Lookup Join ) WITH ( 'connector' = 'paimon', 'path' = 'hdfs:///paimon/orders_realtime', 'scan.mode' = 'latest' -- 实时读取最新数据 ); ``` ##### (2) 每日分区表（维表） ```sql CREATE TABLE product_daily ( product_id INT, product_name STRING, price DECIMAL(10, 2), dt STRING -- 分区字段，格式 'yyyy-MM-dd' ) WITH ( 'connector' = 'paimon', 'path' = 'hdfs:///paimon/product_daily', -- 分区配置 -- 'partition.expiration-time' = '7 d', -- 分区过期策略 'partition.timestamp-formatter' = 'yyyy-MM-dd', 'partition.timestamp-pattern' = '$dt', -- Lookup 优化 -- 'lookup.cache-type' = 'FULL', -- 全量缓存每日分区 'lookup.cache-ttl' = '24 h', -- 缓存24小时（每日更新） 'continuous.discovery-interval' = '1 d' -- 每日检查分区更新[^1] ); ``` --- #### 2. 动态分区关联 SQL ```sql SELECT o.order_id, o.product_id, p.product_name, p.price, o.order_time FROM orders_realtime AS o JOIN product_daily FOR SYSTEM_TIME AS OF o.proc_time AS p ON o.product_id = p.product_id AND p.dt = DATE_FORMAT(o.order_time, 'yyyy-MM-dd') -- 动态关联当日分区 ``` --- #### 3. 核心原理与优化 1. **分区路由机制** - 通过 `DATE_FORMAT(o.order_time, 'yyyy-MM-dd')` 动态定位分区路径 - 示例：`order_time = '2023-10-01 10:00:00'` → 关联分区 `dt='2023-10-01'` 2. **缓存策略优化** | **配置项** | **值** | **作用** | |----------------------------|--------------|------------------------------------------| | `lookup.cache-type` | `FULL` | 全量缓存当日分区数据 | | `lookup.cache-ttl` | `24 h` | 每日自动失效旧缓存 | | `continuous.discovery-interval` | `1 d` | 每日自动检测新分区[^1] | 3. **数据一致性保障** - 当新分区（如 `dt=2023-10-02`）写入后： - `continuous.discovery-interval` 触发分区发现 - 新查询自动路由到新分区 - 旧分区缓存按 TTL 自动清除 --- #### 4. 性能调优建议 1. **分区管理** ```sql -- 自动清理历史分区 'partition.expiration-time' = '7 d' ``` 2. **异步加载** ```sql 'lookup.async' = 'true', 'lookup.async-thread-number' = '4' -- 并行加载分区数据 ``` 3. **内存控制** ```sql -- 限制单分区内存占用 'table.exec.resource.default-parallelism' = '8', 'taskmanager.memory.task.off-heap.size' = '512mb' ``` --- #### 5. 监控指标通过 Flink Web UI 监控： - **分区命中率**：`paimon.dynamic.partition.hit-ratio` - **缓存加载延迟**：`paimon.lookup.load-duration` - **分区更新延迟**：`paimon.partition.discovery-latency` --- > **关键提示**：每日分区表需在 **业务低峰期** 批量更新（如凌晨），避免流处理过程中分区切换导致性能波动[^2]。