Flink Checkpoint 流程同步还是异步？

最新推荐文章于 2024-12-03 15:27:57 发布

原创最新推荐文章于 2024-12-03 15:27:57 发布 · 2.9k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

本文深入探讨了Apache Flink的checkpoint机制，揭示其并非单纯的同步或异步过程。在算子接收到barrier后，会同步执行CheckpointedFunction的snapshotState以及broadcaststate的深拷贝备份。后续的远程存储上传操作则是异步进行。这一流程涉及关键状态的管理和恢复，确保流处理的准确性和一致性。

对于 flink checkpoint 的流程，大概分为这几部分。

1. broadcast state 备份存储

2. keyed state 备份存储

3. 用户实现的 CheckpointedFunction 执行

本文主要说明 1 3 部分，2 有时间再补充

先说结论

flink 的 checkpoint 流程并非全同步或全异步，是同步异步并存的。

流程：

算子收到 barry 后，会同步做以下操作：

1. 执行用户实现的 CheckpointedFunction - snapshotState。

2. 将现有的 broadcast state 深拷贝，其中副本用来备份。

准备完毕后，会异步执行上传到远端存储备份的操作。

两部分分别在两个函数中执行。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。