scala dataframe添加一列行号到开头

该博客分享了一种在Apache Spark的DataFrame中添加行号的方法,包括如何将行号添加到数据框的开头和末尾。示例代码展示了使用`monotonically_increasing_id`函数实现这一功能,并给出了操作后的数据展示。

需求

项目有时候需要在dataframe开头添加字段,之前也没搜到好的案例。下面就写个相对简洁的方法。

实现

import org.apache.spark.sql.SparkSession
import org.apache.spark.sql.functions.{col, monotonically_increasing_id}

object SparkTest4 {
  def main(args: Array[String]): Unit = {
    val sc = SparkSession.builder().master(master = "local[4]").getOrCreate()
    import sc.implicits._
    var df = Seq(
      (1, "First Value"),
      (2, "Second Value")
    ).toDF("int_column", "string_column")
    // 添加到末尾
    df = df.withColumn("end_row_key", monotonically_increasing_id())
    // 添加到开头
    df = df.select(monotonically_increasing_id().as("start_row_key"), col("*"))
    df.show()
  }
}

结果

+-------------+----------+-------------+-----------+
|start_row_key|int_column|string_column|end_row_key|
+-------------+----------+-------------+-----------+
|            0|         1|  First Value|          0|
|            1|         2| Second Value|          1|
+-------------+----------+-------------+-----------+
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值