spark笔记之数据源之JDBC

最新推荐文章于 2023-07-25 10:26:44 发布

原创最新推荐文章于 2023-07-25 10:26:44 发布 · 350 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#spark笔记 #spark笔记之数据源 #JDBC

技术文章专栏收录该内容

930 篇文章

订阅专栏

本文介绍了如何使用Spark SQL通过JDBC接口与MySQL进行数据交互。详细讲解了从MySQL加载数据到DataFrame，以及如何将DataFrame中的数据写回MySQL的过程，包括在IDEA中编写代码、spark-shell运行及打包提交到Spark集群的操作步骤。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1． JDBC

Spark SQL可以通过JDBC从关系型数据库中读取数据的方式创建DataFrame，通过对DataFrame一系列的计算后，还可以将数据再写回关系型数据库中。

1.1． SparkSql从MySQL中加载数据
1.1.1 通过IDEA编写SparkSql代码

执行查看效果：

1.1.2 通过spark-shell运行

（1）、启动spark-shell(必须指定mysql的连接驱动包)

[AppleScript] 纯文本查看 复制代码

01

02

03

04

05

06

07

08

09

10

11

spark-shell \

--master spark://hdp-node-01:7077 \

--executor-memory 1g \

--total-executor-cores 2 \

--jars /opt/bigdata/hive/lib/mysql-connector-java-5.1.35.jar \

--driver-class-path /opt/bigdata/hive/lib/mysql-connector-java-5.1.35.jar

（2）、从mysql中加载数据

[AppleScript] 纯文本查看 复制代码

1	`val mysqlDF` `=` `spark.read.format("jdbc").options(Map("url"` `->` `"jdbc:mysql://192.168.200.150:3306/spark",` `"driver"` `->` `"com.mysql.jdbc.Driver",` `"dbtable"` `->` `"iplocation",` `"user"` `->` `"root",` `"password"` `->` `"123456")).load()`

（3）、执行查询

1.2． SparkSql将数据写入到MySQL中1.2.1 通过IDEA编写SparkSql代码

（1）编写代码

（2）用maven将程序打包

通过IDEA工具打包即可

（3）将Jar包提交到spark集群

[AppleScript] 纯文本查看 复制代码

01

02

03

04

05

06

07

08

09

10

11

12

13

14

15

spark-submit \

--class itcast.sql.SparkSqlToMysql \

--master spark://hdp-node-01:7077 \

--executor-memory 1g \

--total-executor-cores 2 \

--jars /opt/bigdata/hive/lib/mysql-connector-java-5.1.35.jar \

--driver-class-path /opt/bigdata/hive/lib/mysql-connector-java-5.1.35.jar \

/root/original-spark-2.0.2.jar /person.txt

（4）查看mysql中表的数据

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。