错误如图:
代码:
object Mysql extends App{
val sparkConf = new SparkConf()//.setAppName("RDDRelation").setMaster("local[1]")
val sc=new SparkContext(sparkConf)
val sqlContext = new SQLContext(sc)
sqlContext.setConf("spark.sql.warehouse.dir","file:///")
val url="jdbc:mysql://114.55.96.216:3306/test"
// val url = "jdbc:mysql://114.55.96.216:3306/test?user=test&password=1234"
val prop = new java.util.Properties
prop.setProperty("user","test")
prop.setProperty("password","1234")
//jdbc1*******************
val number=10
val str1=s"userid>$number"
val s=sqlContext.read.format("jdbc").jdbc(url,"userinfo",Array[String](str1),prop).select("username").rdd.distinct().collect()
val s1=s.map(_.toString().replaceAll("\\[|\\]",""))
println("*"*50)
s1.foreach(println(_))
println("*"*50)
//jdbc2*******************
val jdbcDF = sqlContext.read.format("jdbc")
.options(Map("url" -> "jdbc:mysql://114.55.96.216:3306/test",
"driver" -> "com.mysql.jdbc.Driver",
"dbtable" -> "userinfo" ,
"user" -> "test",
"password" -> "1234")).load()
jdbcDF.show()
// sqlContext.read.format("jdbc")
}依赖:
mysql的jar包在打包时时就已经打进去了,
提交到集群上运行时jdbc1错误。如图1,jdbc2正常
但是jdbc2是拉取整个表的数据,不能条件从数据库查询出部分数据,
解决方法,上传一个 mysql-connector-java-5.1.35.jar至服务器
submit时指定jar包
如:
bin/spark-submit \
--master yarn \
--class test.Mysql \
--driver-class-path /usr/hdp/2.4.0.0-169/spark/lib/mysql-connector-java-5.1.35.jar \
/usr/hdp/2.4.0.0-169/spark/jar/test-scala.jar
,问题解决
本文介绍了一种在Spark中使用JDBC连接MySQL时遇到的问题及解决方案。通过两种不同的方式尝试从MySQL中读取数据,发现一种方法无法正确传递查询条件,而另一种虽然成功但无法指定查询条件。最终通过在服务器上单独上传MySQL连接器并指定路径解决了问题。
4156

被折叠的 条评论
为什么被折叠?



