前言
sortBy,顾名思义排序的意思,在Spark 中,使用sortBy可以对一组待处理的数据进行排序,这组数据不限于数字,也可以是元组等其他类型;
sortBy
函数签名
def sortBy[K](f: (T) => K , ascending: Boolean = true , numPartitions: Int = this.partitions.length)(implicit ord: Ordering[K], ctag: ClassTag[K]): RDD[T]
本文详细介绍了Spark的sortBy算子,包括其函数签名和用法。通过案例演示,展示了如何使用sortBy对不同类型的数据显示排序效果,如数字和元组,并将排序后的数据保存到本地文件。
sortBy,顾名思义排序的意思,在Spark 中,使用sortBy可以对一组待处理的数据进行排序,这组数据不限于数字,也可以是元组等其他类型;
def sortBy[K](f: (T) => K , ascending: Boolean = true , numPartitions: Int = this.partitions.length)(implicit ord: Ordering[K], ctag: ClassTag[K]): RDD[T]
1826
1665
415
6166
1687

被折叠的 条评论
为什么被折叠?