Flink cdc+ doris 大宽表实践~

面对大宽表关联问题,Flink SQL 的状态管理可能导致OOM。解决方案是使用Doris,通过Agg模型创建大宽表,处理多流插入并解决主键冲突。Flink CDC 可直接将数据写入Doris,但维表主键生成与数据延迟是挑战。TiDB虽有类似功能,但成本较高。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

还没整理好,别慌。

一,业务问题:

多个表关联join(涉及时间维度跨度很长),几乎等同于全量关联,这个时候flink sql join没法做,因为state会无线增大,然后OOM。

二,解决方案 :

使用doris去做大宽表。

方案1,数据写入ods层,然后sql语句关联定时写入dws层,类似离线批处理。

这种就是替代hive离线计算的方案。

方案2,数据写入大宽表,利用doris特性。



https://cloud.baidu.com/doc/DORIS/s/3kmealtpc

1)创建doris大宽表 -Agg模型

可以尝试自己去创建一个表,相同的主键数据  后者字段值会覆盖前者,而不是想unqi模型一样是相同主键 整行数据替换。

2) 插入对应的数据

评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值