1、countByKey: 对每个键对应的元素分别计数。
scala> val a = Seq((1,2),(3,4),(3,6))
a: Seq[(Int, Int)] = List((1,2), (3,4), (3,6))
scala> rdd.countByKey()
res10: scala.collection.Map[Int,Long] = Map(1 -> 1, 3 -> 2)
2、collectAsMap(): 将结果以映射表的形式返回,以便查询
scala> rdd.collectAsMap()
res11: scala.collection.Map[Int,Int] = Map(1 -> 2, 3 -> 6)
从结果可以知道,collectAsMap()对一个键有多个值的进行覆盖只保留最后一个。
3、lookUp(key): 返回给定键对应的所有值:
scala> rdd.lookup(3)
res13: Seq[Int] = WrappedArray(4, 6)