Flink检查点（checkpoint）、保存点（savepoint）的区别和联系

最新推荐文章于 2025-09-09 16:01:46 发布

原创

最新推荐文章于 2025-09-09 16:01:46 发布 · 2.2k 阅读

15 ·

CC 4.0 BY-SA版权

文章标签：

#flink

本文详细介绍了Flink的检查点（checkpoint）和保存点（savepoint）的区别和联系。检查点用于实现容错，周期性生成状态快照，允许在故障后恢复。保存点则是自包含的全量状态快照，适用于作业升级、迁移等场景。两者都是基于Flink的Checkpoint机制，但savepoint更侧重于作业维护的灵活性和可移植性，支持并行度改变和代码升级后的恢复。此外，文章还讨论了如何配置和使用这两者。

一、Flink checkpoint

Checkpoint是Flink实现容错机制最核心的功能，能够根据配置周期性的基于Stream中各个Operator的状态来生成Snapshot，从而将这些状态数据定期持久存储下来，当Flink程序一旦意外崩溃时，重新运行程序时可以有选择的从这些Snapshot进行恢复，从而修正因为故障带来的程序数据状态中断。

1、Checkpoint指定触发生成时间间隔后，每当需要触发Checkpoint时，会向Flink程序运行时的多个分布式Stream Source中插入一个Barrier标记。

2、当一个Operator接收到一个Barrier时，它会暂停处理Steam中新接收到的数据记录

3、每个Stream中都会存在对应的Barrier，该Operator要等到所有的输入Stream中的Barrier都到达。当所有Stream中的Barrier都已经到达该Operator，这时所有的Barrier在时间上看来是同一个时刻点（表示已经对齐)

4、该Operator会将数据记录（Outgoing Records）发射（Emit）出去，作为下游Operator的输入

5、最后将Barrier对应Snapshot发射（Emit）出去作为此次Checkpoint的结果数据

`开启checkpoint`

val env = StreamExecutionEnvironment.getExecutionEnvironment
env.setStateBackend(new FsStateBackend("hdfs://ip:8020/flink/flink-checkpoints"))
val config = env.getCheckpointConfig
config.enableExternalizedCheckpoints(ExternalizedCheckpointCleanup.RETAIN_ON_CANCELLATION)
config.setCheckpointingMode(Ch