如果在Spark Structured Streaming上使用了Arbitrary Stateful Operations, 也就是使用了mapGroupsWithState
或flatMapGroupsWithState
方法,而其中GroupState[S]
的S又偏偏是一个自定义的类型,那么你就会遇到这个错误!产生这个错误的原因是Spark找不到相应的Encoder
,Encoder的作用是负责JVM类类型和Spark SQL内部表示之间的相互转换。通常大部分的基础类型都通过SparkSession的implicit import
声明了,而自定义的类型需要特别指定对应的Encoder,而这也并不困难,通过kryo我们可以方便地创建出encoder来解决这个错误。例如:假定我们的自定义State叫MyState,我们可以这样做:
import sparkSession.implicits.