1、Kafka的offset
- Kafka0.8版本以前,offset默认存储在zookeeper中(基于Zookeeper)
- Kafka0.9版本以后,offset默认存储在内部的topic中,基于 __consumer_offsets 的Topic中。
2、kafka消费offset提交配置
1. checkpoint禁用:
flink kafka消费依赖于内部kafka客户端自动定期的offset提交
配置:enable.auto.commit / auto.commit.interval.ms
2. checkpoint启用:
flink kafka consumer在checkpoint完成时自动提交offset在checkpoint state中;
配置:setCommitOffsetsOnCheckpoints(boolean) 来启用关闭;默认情况下,是开启的true
此模式下,配置在properties中自动周期性的offset提交将被忽略;
3、程序出现了异常,恢复subTask,读取偏移量,从StateBackend恢复还是kafka中恢复?
1、StateBackend 偏移量目录,你会发现kafka中特殊的topic也有偏移量,但是它不是用来恢复的,是用来做监控的。
2、如果你不想让kafka中特殊的topic有偏移量,也可以取消。官网中这样记载。

3、只需要添加一下:
// kafka中的偏移量取消掉【不建议false,默认是true,它用来监控这个偏移量】
kafkaSource.setC

本文介绍了Kafka从0.8到0.9版本中offset存储位置的变化,以及Flink与Kafka集成时的offset提交配置。在checkpoint启用时,Flinkkafkaconsumer会在checkpoint时自动提交offset。当程序异常恢复,offset通常从StateBackend恢复。关闭offset提交到kafka的特殊topic可以避免冗余监控信息。在程序停止时,若开启了checkpointing,offset会保存在StateBackend中。
最低0.47元/天 解锁文章
4876

被折叠的 条评论
为什么被折叠?



