spark jar包方式运行hive步骤

最新推荐文章于 2023-04-12 19:23:05 发布

技术蚂蚁

最新推荐文章于 2023-04-12 19:23:05 发布

阅读量2.8k

点赞数

CC 4.0 BY-SA版权

分类专栏： Spark Hive

本文链接：https://blog.youkuaiyun.com/u011007180/article/details/52294608

Spark 同时被 2 个专栏收录

88 篇文章

订阅专栏

Hive

13 篇文章

订阅专栏

本文介绍如何使用Maven打包并正确配置Spark应用以连接MySQL数据库，包括解决因不同配置方式导致的错误。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1,用maven install 打包
2，配置好下面的脚本，其中--driver-class-path要选择mysql的jar包所在的目录，另外有博客说可以在spark-env指定
export SPARK_CLASSPATH=$SPARK_HOME/lib/mysql-connector-java-5.0.8-bin.jar
-----注意配置了--driver-class-path 就不能再配spark-env不然，启动会报错：
Exception in thread "main" org.apache.spark.SparkException: Found both spark.driver.extraClassPath and SPARK_CLASSPATH. Use only the former.

----但是用spark-env的方式配置，运行还是报错找不断mysql驱动：

Caused by: org.datanucleus.exceptions.NucleusException: Attempt to invoke the "BONECP" plugin to create a ConnectionPool gave an error : The specified datastore driver ("com.mysql.jdbc.Driver") was not found in the CLASSPATH. Please check your CLASSPATH specification, and the name of the driver.

run-sql.sh内容：
#!/bin/sh
FWDIR="$SPARK_HOME"
$FWDIR/bin/spark-submit \
--class zfh.spark.study.hive.HiveDataSource \
--num-executors 3 \
--driver-memory 512m \
--executor-memory 512m \
--executor-cores 3 \
--files /home/zfh/apache/hive-2.0.0/conf/hive-site.xml \
--driver-class-path /home/zfh/apache/hive-2.0.0/lib/mysql-connector-java-5.0.8-bin.jar \
/home/zfh/runjar/spark-study-java-0.0.1.jar \