
scala
文章平均质量分 64
yyoc97
--
展开
-
scala dataframe添加一列行号到开头
需求项目有时候需要在dataframe开头添加字段,之前也没搜到好的案例。下面就写个相对简洁的方法。实现import org.apache.spark.sql.SparkSessionimport org.apache.spark.sql.functions.{col, monotonically_increasing_id}object SparkTest4 { def main(args: Array[String]): Unit = { val sc = SparkSessio原创 2021-04-30 16:35:00 · 1332 阅读 · 2 评论 -
scala cube聚合操作实例
前言因为内部平台spark-sql不方便调优、配置资源的因素,某些情况还是会用到scala dateframe操作数据,今天记录一些关于聚合,count distinct多个字段,重名展示的一些示例。数据准备Jack2 22 20200405Jack2 21 20200401Jack2 21 20200401Kate 22 20200406Mi2ng 20 20200406代码示例def main(args: Array[String]): Unit = { val sc = S原创 2020-12-08 16:27:40 · 418 阅读 · 0 评论 -
scala(Row、Array、Tuple、Class、RDD、DF之间类型转换)
前言spark中因为Rdd和Dataframe的一些分装函数处理,经常会遇到类型的相关转换,今天就记录些常见的几种类型转换。Array => Rowval arr = Array("aa/2/cc/10","xx/3/nn/30","xx/3/nn/20")// val row = Row.fromSeq(arr)val row = RowFactory.create(arr)Row => Arrayval a:Array[Any] = row.toSeq.toArray有时原创 2020-10-25 15:34:17 · 12585 阅读 · 0 评论