StructedStreaming Excalty-onece的优越性

本文探讨了Kafka在数据处理中的角色,特别是在offsets的管理与wal机制下的数据恢复流程。同时深入分析Structured Streaming的statestore机制如何确保excatly-once语义,通过维护resulttable来实现高效的数据恢复。

(1)数据在从kafka出来的时候,每一条数据对应的offsets会写到wal,将对应的offset写入到文件

 一旦程序挂掉,从wal offset log里面恢复最新的数据,

(2)structed streaming的state store机制对于excatly-once的作用

首先会维护一个result table在内存中,这里面只存结果数据(比如聚合好的数据),

当作数据恢复时,会首先获取是否已经走到写resuttable这个过程,没走到则直接写入result table

走到则覆盖或者跳过(上次已经算好了)

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值