最近遇到个问题,flink消费kafka直接用kafka设置却无法从最新的开始消费
auto.offset.reset=latest
后面直接通过
FlinkKafkaConsumer.setStartFromTimestamp(1624896000000L)
实现从指定位置消费
- setStartFromGroupOffsets,也是默认的策略,从 group offset 位置读取数据,group offset 指的是 kafka broker 端记录的某个 group 的最后一次的消费位置。但是 kafka broker 端没有该 group 信息,会根据 kafka 的参数 "auto.offset.reset" 的设置来决定从哪个位置开始消费。
- setStartFromEarliest,从 kafka 最早的位置开始读取。
- setStartFromLatest,从 kafka 最新的位置开始读取。
- setStartFromTimestamp(long),从时间戳大于或等于指定时间戳的位置开始读取。Kafka 时戳,是指 kafka 为每条消息增加另一个时戳。该时戳可以表示消息在 proudcer 端生成时的时间、或进入到 kafka broker 时的时间。
- setStartFromSpecificOffsets,从指定分区的 offset 位置开始读取,如指定的 offsets 中不存某个分区,该分区从 group offset 位置开始读取。此时需要用户给定一个具体的分区、offset 的集合。
本文探讨了 Apache Flink 中 Kafka 消费者不同起始位置设置的方法,包括使用 auto.offset.reset 参数、setStartFromTimestamp 和 setStartFromSpecificOffsets 等方式,并解释了这些配置如何影响数据消费。
2338

被折叠的 条评论
为什么被折叠?



