Flink SQL -- CheckPoint

最新推荐文章于 2024-04-13 06:42:56 发布

新手小农

最新推荐文章于 2024-04-13 06:42:56 发布

阅读量2k

点赞数

分类专栏： Flink 1.15.2 文章标签： flink 大数据

本文链接：https://blog.youkuaiyun.com/m0_62078954/article/details/134211312

版权

1、开启CheckPoint

checkpoint可以定时将flink任务的状态持久化到hdfs中，任务执行失败重启可以保证中间结果不丢失

# 修改flink配置文件
vim flink-conf.yaml

# checkppint 间隔时间
execution.checkpointing.interval: 1min
# 任务手动取消时保存checkpoint
execution.checkpointing.externalized-checkpoint-retention: RETAIN_ON_CANCELLATION
# 同时允许1个checkpoint执行
execution.checkpointing.max-concurrent-checkpoints: 1
execution.checkpointing.min-pause: 0
# 数据处理的语义
execution.checkpointing.mode: EXACTLY_ONCE
# checkpoint超时时间
execution.checkpointing.timeout: 10min
execution.checkpointing.tolerable-failed-checkpoints: 0
execution.checkpointing.unaligned: false
# 状态后端（保存状态的位置，hashmap：内存）
state.backend: hashmap
# checkpoint路径
state.checkpoints.dir: hdfs://master:9000/flink/checkpoint

2、编写一个Flnik SQL 脚本：

vim word_count.sql

-- 实时从kafka中读取单词，统计单词的数量，将结果保存到mysql中

-- 1、创

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

新手小农

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Flink SQL Checkpoint 学习总结

主要分享大数据相关的知识，如Spark、Hudi

03-03

5566

学习总结Flink SQL Checkpoint的使用，主要目的是为了验证Flink SQL流式任务挂掉后，重启时还可以继续从上次的运行状态恢复。对于flink sql读取mysql，设置checkpoint恢复不生效（不是flink cdc）checkpoint 一个时间间隔内只有一个批次，这样才能保证eos,时间间隔大小影响写入性能。

Flink checkpoint机制

litlit023的专栏

01-18

851

目录 1. checkpoint的用途 2. checkpoint的生成机制 3. checkpoint的状态存储 4. job的重启策略 5. 参考资料可保证Flink集群在某个算子因为某些原因(如异常退出)出现故障时，能够将整个应用流图的状态恢复到故障之前的某一状态，保证应用流图状态的一致性。 1. checkpoint的用途某个算子故障，保证整个应用流图状态，恢复到之前的某一个状态。 2. checkpoint的生成机制 checkpoint 协调器，控制这每一次checkp

参与评论您还未登录，请先登录后发表或查看评论

Flink sql-client save checkpoint 测试

weixin_54527017的博客

01-14

2611

Flink sql-client save checkpoint 测试

实践数据湖iceberg 第二十三课 flink-sql从checkpoint重启

spark_dev的博客

02-23

4677

成功测试flink-sql以非jar包的方式从checkpoint重启，完成故障恢复测试实践数据湖icerberg专栏本专栏记录iceberg菜鸟到专家的过程，记录踩坑，填坑，iceberg特征的了解与原理的认知

uitableview group的一些问题（设置两个section之间的距离，设置背景颜色等）在plain下去掉foot view的粘性

jimy86022的专栏

03-21

8004

1.group 时背景颜色设置 UIView *backview = [[UIView alloc]init]; backview.backgroundColor = [UIColor redColor]; self.tableView.backgroundView = backview; self.tableView.backgroundColor = [UICol

flink-sql-platform

02-14

《Flink SQL 平台深度解析》在大数据处理领域，Apache Flink 以其低延迟、高吞吐量以及强大的流处理能力而受到广泛关注。Flink SQL Platform 是基于 Apache Flink 构建的一个用于实现 SQL 风格数据处理的平台，它...

flink sql-client.sh 使用教程

yy的博客

07-03

775

flink sql-client

演示实时-mysql-flinksql-mysql/doris

someInNeed的博客

08-09

472

代码】演示实时-mysql-flinksql-mysql。

flink-1.14.0-bin-scala_2.11.tgz

07-18

- SQL 支持：增强 SQL API，支持更多 SQL 功能，简化开发流程。 - 容错机制：改进了 JobManager 的高可用性，降低了故障恢复时间。总的来说，Apache Flink 1.14.0 是一个强大且灵活的实时数据处理平台，适用于各种...

flink sql checkpoint 调优配置

wangqiaowq的博客

08-21

4954

`execution.checkpointing.externalized-checkpoint-retention`: 外部化检查点的保留策略。- `execution.checkpointing.tolerable-failed-checkpoints`: 允许的连续失败检查点的最大数量。- `execution.checkpointing.max-concurrent-checkpoints`: 并发生成检查点的最大数量。如果设置为`true`，则检查点将在作业的所有任务完成之前生成。

flink checkpoint 重启_Flink Sql on Zeppelin之Checkpoint应用

weixin_36319281的博客

01-19

1936

1 概述我们都知道，使用Scala或者Java写代码的时候可以配置Flink Checkpoint:valenv=StreamExecutionEnvironment.getExecutionEnvironment .enableCheckpointing(5 * 60 * 1000)val checkpointConfig = env.getCheckpointConfigch...

Flink的CheckPoint机制

分享Java技术知识，共同成长进步！

08-25

2029

这里已经是Flink的第三篇原创啦。第一篇：Flink入门讲解了Flink的基础和相关概念，第二篇：压背原理，讲解了什么是背压，在Flink背压大概的流程是怎么样的。这篇来讲Flink另一个比较重要的知识，就是它的容错机制checkpoint原理。所谓的CheckPoint其实就是Flink会在指定的时间段上保存状态的信息，如果Flink挂了可以将上一次状态信息再捞出来，重放还没保存的数据来执行计算，最终可以实现exactly once。状态只持久化一次到最终的存储介质中（本地数据库/HDFS)

FlinkSQL的Watermark机制和Checkpoint机制

sijiwang95的博客

04-12

2073

Watermark机制，就是水印机制，也叫做水位线机制。就是专门用来解决流式环境下数据迟到问题的。

Flink 启用与配置检查点 Checkpoint

SmartSi

09-25

1506

Flink 中每个函数和算子都可以是有状态的（请参阅了解详细信息）。有状态函数在处理单个元素/事件时会存储数据。为了能够使状态可以容错，Flink 需要对状态进行 Checkpoint。Checkpoint 可以允许 Flink 在流中恢复状态以及消费位置。关于 Flink 容错机制背后的技术请参阅的详细文档。

flink sql checkpoint 调优配置_execution，2024年最新2024年大数据开发阿里&腾讯&百度&字节校招面试汇总

最新发布

2401_84160272的博客

04-13

970

行业感兴趣的新人，都欢迎扫码加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

Flink作业开发清单(3)——Checkpoint

TRX的博客

03-25

1495

Checkpoint Checkpoint功能可以保证作业失败重启或升级重启后，从上次"离开"的位置继续运行；比如Flink Kafka就是通过Checkpoint记录消费的Offset记录的；如果没有开启Checkpoint，那么每次重启作业可能会重复消费数据或者丢失数据（与配置相关）； 1.开启Checkpoint StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); Che

Flink-CheckPoint

Samooyou的博客

05-11

599

CK配置 //获取flink的运行环境 StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); // 每隔1000 ms进行启动一个检查点【设置checkpoint的周期】 env.enableCheckpointing(1000); // 高级选项： // 设置模式为exactly-once （这是默认值） env.getCheckpointConfig().setCheckpoi

Hudi系列25: Flink SQL使用checkpoint恢复job异常

只是甲的博客

05-23

1974

如果是整个yarn-session异常，也可以启动yarnsession的时候指定checkpoint。在网上看到的资源都是针对代码级别的，没有看到Flink SQL级别的。对于一些大表，最好还是先通过Spark进行初始化，然后在接增量。把yarn-session的资源由8G提升到16G问题解决。在Flink web界面将Flink SQL任务手工结束掉。Flink可以自己重试，这个还是比较不错，无需人工干预。等mysql启动成功之后，任务又可以继续衔接上。看来是我的checkpoint都没成功。

flink-sql 从checkpoint 恢复任务

04-28

Flink SQL是一个支持流和批两种模式的分布式计算框架，它能够用于各类大数据场景。Flink SQL从1.9版本开始支持基于SQL的批处理功能，最新版本的Flink SQL 1.14.0也都已经逐渐趋于完善。对于如何从checkpoint中恢复flink-sql任务，实际上与其他flink任务的恢复方式类似。flink-sql在运行过程中，产生了各种状态，如checkpoint状态、状态后端中的状态，元数据等。当一个flink-sql任务意外停止时，重启该任务会需要使用这些状态信息来恢复任务运行的正确状态。首先，我们需要选定需要的状态后端。Flink提供了不同的状态后端，如memory、filesystem、rocksDB等，在配置文件中选定所需的状态后端，进而启动flink-sql任务。这样flink-sql任务就会产生一系列状态信息，存储在指定的状态后端中。其次，我们需要设置checkpoint，以保证flink-sql任务在运行过程中产生的状态信息能够被及时保存。Flink提供了不同的checkpoint触发机制，如时间间隔、数据量等，可以根据具体情况选择。最后，在flink-sql任务出现异常中断时，可以通过使用之前保存的checkpoint状态信息来恢复flink-sql任务，保证任务持续运行。具体可以使用flink提供的命令行工具或者API进行操作。需要注意的是，在使用flink-sql重启任务时，要确保数据源的指针位于正确的位置，否则将可能导致脏数据的产生，从而影响计算结果的正确性。