flink流式任务从savepoint恢复方案

最新推荐文章于 2024-05-14 14:03:30 发布

原创

最新推荐文章于 2024-05-14 14:03:30 发布 · 3k 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#flink

本文介绍了Flink流式任务在遇到故障或版本升级时的恢复策略，包括任务取消时不删除Checkpoint和定时触发Savepoint。通过设置保留Checkpoint，任务可以从已有的Checkpoint直接恢复。此外，还讨论了如何利用Flink的RestAPI定时触发Savepoint，并解决了在Yarn-session中调用API的问题。

flink流式任务从savepoint恢复方案

背景
方案一：任务取消时不删除Checkpoint
方案二：定时触发Savepoint
参考

背景

为了方便flink作业以sql形式开发、发布、运维，我们建立了flink任务管理平台，其中有一些任务可能因为一些故障（比如机器down掉）而执行restart strategy无果后失败，如果升级了flink版本需要重新发布一些任务，这就需要从最近的checkpoint恢复任务，保存checkpoint/savepoint是很有必要的。在这里有两种方案，第一种方案是任务取消时不删除checkpoint，第二种方案时定时触发savepoint。

方案一：任务取消时不删除Checkpoint

Checkpoint是为JobManager检测到任务Task失败时自动重新拉起任务设计的，Savepoint是为因为一些原因比如集群迁移、flink版本升级而需要重新发布整个Job设计的，但是在实现机制上这两者几乎是一样的，除非要用到增量Checkpoint，具体可参考链接。
那么在没用到增量Checkpoint的场景下Job是可以直接从保存的Checkpoint的恢复的。通常情况下，如果没有专门设置，Job取消时会把外部存储的Checkpoint删除，可以做如下设置保留Checkpoint文件：

env.getCheckpointConfig().enab

最低0.47元/天解锁文章

4 条评论

第一片心意 2022.02.28
configuration.set("execution.savepoint.path", chkPath); 这个configuration是哪个对象，是怎么获取的？
- WaiSaa回复第一片心意 2022.08.09
  // 从保存点恢复 Configuration configuration = new Configuration(); configuration.setString("execution.savepoint.path", "file:///tmp/flinkcdc/28b1bf7fc1908e83a2578acbd6aaa2c5/chk-12"); StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(configuration); // 设置保存点 env.enableCheckpointing(3000); // 设置本地保存（如果是windows默认盘为当前项目所在的盘） env.getCheckpointConfig().setCheckpointStorage("file:///tmp/flinkcdc/");
- 第一片心意回复3分钟秒懂大数据 2022.03.28
  能给个示例代码么，new 出来之后，是放到哪个对象中，然后让其生效。
- 3分钟秒懂大数据回复第一片心意 2022.03.25
  Configuration configuration = new Configuration(); new 出来的