常见问题----Spark Streaming 读取User Group ID设置

最新推荐文章于 2024-03-24 19:27:20 发布

原创最新推荐文章于 2024-03-24 19:27:20 发布 · 1.1k 阅读

0 ·

CC 4.0 BY-SA版权

实时大数据专栏收录该内容

6 篇文章

订阅专栏

本文探讨了Spark Streaming DirectStream中设置UserGroupID的方法及其优缺点，特别是当Kafka中不再保存对应的Offset数据时如何避免出现OffsetOutOfRangeException错误。文中提供了几种解决方案，包括修改UserGroupID、使用KafkaConsumer的seek方法重置Offset等。

在Spark Streaming DirectStream中设置User Group ID，优点是可跟踪Kafka中此Group ID的Offset，下次重启时从上次中断的地方开始读数据。但是如果Kafka中已经不保存对应Offset的数据，则会报java.lang.ClassNotFoundException: kafka.common.OffsetOutOfRangeException的错误。

解决方法：DirectStream修改User Group ID,或者采用KafkaConsumer的seek方法重设置此user group的offset，或者使用默认User Group ID

开发者社区活动，使用SODBASE产品的程序员现在可以领礼品啦