关于spark 设置redis offset，初始启动时报错，提示Offsets out of range with no configured reset policy for partitions-优快云博客

本文链接：https://blog.youkuaiyun.com/Programma12/article/details/128056157

本文介绍了在使用Spark Streaming连接Kafka时，如何处理初始偏移量设置错误的情况。当指定的offset超出Kafka的上界或下界，Kafka会根据auto.offset.reset策略重置offset。在启动时，如果offset设置不正确，Spark将按照用户设定处理，可能导致错误信息。示例代码展示了如何在初始化时获取和更新offset，并在遇到OutOfRange错误时进行修正。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、当通过sparkstreaming连接kafka，即使你指定了一个不存在offset，即大于上边界或小于下边界，Kafka也将会根据这一条配置reset你的offset值，比如earliest或latest。

2、初始启动时，指定了一个OutOfRange的初始offset时，Spark不会理你的auto.offset.reset，而是按照用户设置的来，但是由于设置的数组上界比如超过本身存储的上界，或者存储的下界超过了本身存储的下界，那么就会得到提示的报错信息

3、因此需要设定修改默认值

import org.apache.kafka.clients.consumer.KafkaConsume

val consumer = new KafkaConsumer[String, String](pros)
consumer.subscribe(util.Collections.singletonList(userPlaySongTopic))
consumer.poll(1000)
// fromOffsets该处即为你根据kafka初始设定的partition保存的的offset值
for (topicPartition <- fromOffsets.keySet) {
  consumer.seekToBeginning(util.Collections.singletonList(topicPartition))
  // 得到这个topic所有partition中的offset
  val offset: Long = consumer.position(topicPartition)
  println("offset:" + offset)
  //获得redis保存的offset
  val consumedOffset: Long = fromOffsets.getOrElse(topicPartition, 0L)
  println("consumedOffset:" + consumedOffset)
  if (offset > consumedOffset) {
    fromOffsets = fromOffsets.updated(topicPartition, offset)
  }