spark中序列化错误,sparkStreaming将wordcount单词统计结果插入mysql

本文探讨了在使用Spark Streaming进行实时数据处理,并尝试将结果写入MySQL数据库时遇到的Task not serializable错误。通过分析代码示例,详细解释了错误原因在于JDBC连接无法被序列化,提出了正确的解决方案,即将数据库操作封装在foreachPartition方法中,以避免序列化问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

做spark开发错误 task不能序列化

18/09/25 14:47:35 ERROR JobScheduler: Error running job streaming job 1537858055000 ms.1
org.apache.spark.SparkException: Task not serializable

是什么不能序列化呢?是mysql连接,这种写法是错误的
//将结果输出到mysql中

result.foreachRDD(rdd => {
val connection = createConnection()
rdd.foreach { r =>
val sql = "insert into table wordCount Values('" + r._1 + "','" + r._2 + "')"
connection.createStatement().execute(sql)
}
})

package streaming

import java.sql.DriverManager

import org.apache.spark.SparkConf
import org.apache.spark.streaming.dstream.{DStream, ReceiverInputDStream}
import org.apache.spark.streaming.{Seconds, StreamingContext}

/**
  * 使用spark streaming 完成有状态统计,并将结果写入到mysql数据库中
  */

object ForeachRDDAPP {
  def main(args: Array[String]): Unit = {
     val conf: SparkConf = new SparkConf().setAppName("ForeachRDDAPP").setMaster("local[2]")
    val ssc = new StreamingContext(conf,Seconds(5))

    ssc.checkpoint(".")

    val line: ReceiverInputDStream[String] = ssc.socketTextStream("192.168.100.100",7777)

    val result: DStream[(String, Int)] = line.flatMap(_.split(" ")).map((_ , 1 )).reduceByKey( _ + _ )

//此处是打印到控制台
    result.print()


    //将结果输出到mysql中

//    result.foreachRDD(rdd => {
//      val connection = createConnection()
//      rdd.foreach { r =>
//        val sql = "insert into table wordCount Values('" + r._1 + "','" + r._2 + "')"
//        connection.createStatement().execute(sql)
//      }
//    })



    result.foreachRDD { rdd =>
      rdd.foreachPartition { partitionOfRecords =>

          // ConnectionPool is a static, lazily initialized pool of connections
          val connection = createConnection()
          partitionOfRecords.foreach(r => {
            val sql = "insert into  wordCount Values('" + r._1 + "'," + r._2 + ")"
            connection.createStatement().execute(sql)
          })
          connection.close()
      }
    }


    ssc.start()
    ssc.awaitTermination()
  }

  /**
    * 获取mysql的连接
    * @return
    */
  def createConnection() = {
    Class.forName("com.mysql.jdbc.Driver")
    DriverManager.getConnection("jdbc:mysql://192.168.100.100:3306/test","root","123456")
  }

}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值