大数据实战之路-实时数仓-基于SparkStreaming的流维关联实现

本文以电商交易订单场景为例,探讨如何使用SparkStreaming进行实时数仓建设。内容涵盖订单头和订单行明细的双流join、流与半静态数据的Redis缓存关联、流与维表的广播变量关联,以及通过shell任务提交到Yarn执行。案例源码可在Gitee上找到。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

以电商的交易订单场景为例

业务实现的部分功能

功能设计

任务提交


以电商的交易订单场景为例

描述: 一般的交易订单可能会涉及到多个表的,例如交易订单头信息,交易订单行明细,配送订单等等, 下面以订单头信息和订单行明细两个数据流为例,完成双流join的功能。

流数据介绍:

  1. 交易订单头包含: 订单号, 父订单号, 配送单号, 渠道号, 下单日期, 订单状态, 下单门店, 配送门店, 送货方式, 订单类型, 运费, 订单满减等等
  2. 交易订单行明细包括: 交易订单行明细ID, 订单号, 订单行号,商品编码, 订单商品数量,订单金额,促销金额等等

数据流:

mysql  ---canal-->>   kafka  --Flink-->> kafka --doris-routine-load-->> Doris

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

《数据民工包工头》

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值