【Spark】算子实现delete SQL语句

five小点心

已于 2024-08-15 20:00:15 修改

阅读量527

点赞数 3

分类专栏：日常 # spark 文章标签： spark sql 大数据

于 2024-08-15 19:59:51 首次发布

本文链接：https://blog.youkuaiyun.com/d905133872/article/details/141230477

版权

spark 同时被 2 个专栏收录

15 篇文章

订阅专栏

日常

5 篇文章

订阅专栏

spark计算出来后，得到dataframe，需要删除dataframe中的ids。

在SQL语句中，我们可以通过【delete from table where id in ('id1','id2')】，所以只需要把算到的df转换成string字符串的格式，具体实现如下：

val df = Seq(
    ("111"),("222"),("333")
).toDF("ID")

val delObj = df.select("ID")
    .as[String]
    .map(elem=> s"'$elem'")
    .collect()
    .mkString(",")

val delSql = s"delete from $tableName where $delObj"

Class.forName(//PG配置)
val conn = DriverManager.getConnection(url, properties)
val delPS = conn.prepareStatement(delSql)

var cnt = delPS.executeUpdate()

delPS.close()
conn.close()