Spark序列化问题 java.io.NotSerializableException:org.apache.hadoop.hbase.io.ImmutableBytesWritable

本文探讨了在Spark中遇到java.io.NotSerializableException错误的原因,即ImmutableBytesWritable类未实现序列化。介绍了序列化的必要性及Spark提供的两种序列化方式:JavaSerialization和KryoSerialization,并推荐使用后者。通过代码示例展示了如何设置SparkConf来指定序列化格式为Kryo,并注册需要序列化的类。

java.io.NotSerializableException: org.apache.hadoop.hbase.io.ImmutableBytesWritable
在这里插入图片描述
错误原因是因为 ImmutableBytesWritable不能进行序列化(在Java中,如果类需要序列化需要实现Serializable)

而文件在经过网络传输时需要序列化(网络传输是二进制传输)

在这里插入图片描述
(上图为Spark的官方文档 http://spark.apache.org/docs/2.2.0/index.html
在官方文档中,提供了两种序列化的方式
Java serialization和Kryo serialization
并且推荐使用第二种序列化方式

代码实现
val sparkConf = new SparkConf()
      .setAppName("ReadHBaseTableDataSpark")
      .setMaster("local[2]")
      //指定序列化格式,默认是java序列化
      .set("spark.serializer", "org.apache.spark.serializer.KryoSerializer")
      //告知哪些类型需要序列化
      .registerKryoClasses(Array(classOf[ImmutableBytesWritable], classOf[Result]))

 
    评论
    添加红包

    请填写红包祝福语或标题

    红包个数最小为10个

    红包金额最低5元

    当前余额3.43前往充值 >
    需支付:10.00
    成就一亿技术人!
    领取后你会自动成为博主和红包主的粉丝 规则
    hope_wisdom
    发出的红包
    实付
    使用余额支付
    点击重新获取
    扫码支付
    钱包余额 0

    抵扣说明:

    1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
    2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

    余额充值