Spark SQL使用 JDBC 从其他数据库读取数据的数据源

最新推荐文章于 2025-04-14 22:26:17 发布

wx_Jum

最新推荐文章于 2025-04-14 22:26:17 发布

阅读量805

点赞数

分类专栏： Spark

本文链接：https://blog.youkuaiyun.com/weixin_44327656/article/details/89916281

版权

Spark 专栏收录该内容

18 篇文章

订阅专栏

spark-shell方式读取

bin/spark-shell --driver-class-path ***.jar --jars ***.jar

用户可以使用 Data Sources API 将来自远程数据库的表作为 DataFrame 或 Spark SQL 临时视图进行加载。也可以在数据源选项中指定 JDBC 连接属性。用户和密码通常作为登录数据源的连接属性提供。除了连接属性外，Spark 还支持以下不区分大小写的选项:
在这里插入图片描述
2. 编程方式读取

// 加载JDBC数据源
val jdbcDF = spark.read
  .format("jdbc")
  .option("url", "jdbc:postgresql:dbserver")
  .option("dbtable", "schema.tablename")
  .option("user", "username")
  .option("password", "password")
  .load()
// 或者使用Properties传参
val connectionProperties = new Properties()
connectionProperties.put("user", "username")
connectionProperties.put("password", "password")
val jdbcDF2 = spark.read
  .jdbc("jdbc:postgresql:dbserver", "schema.tablename", connectionProperties)

// 保存 JDBC数据源
jdbcDF.write
  .format("jdbc")
  .option("url", "jdbc:postgresql:dbserver")
  .option("dbtable", "schema.tablename")
  .option("user", "username")
  .option("password", "password")
  .save()

jdbcDF2.write
  .jdbc("jdbc:postgresql:dbserver", "schema.tablename", connectionProperties)

// Specifying create table column data types on write
jdbcDF.write
  .option("createTableColumnTypes", "name CHAR(64), comments VARCHAR(1024)")
  .jdbc("jdbc:postgresql:dbserver", "schema.tablename", connectionProperties)