1、Trasformtion算子
union、reduceByKey、groupBy、join、map、mapPartition
、cogroup、parallelize、textFile、leftoutJoin、flatMap、coalesce、Repartition
2、Action算子
count、take、collect、foreach、foreachPartition、saveAsTextFile、ditinct、
first、reduce
3、shuffle算子
reduceByKey、groupBy、join、coalesce、Repartition、leftoutJoin、cogroup
4、产生Stage划分的算子
reduceByKey、groupBy、join、coalesce、Repartition、leftoutJoin、cogroup
5、触发Job算子
count、take、collect、foreach、foreachPartition、saveAsTextFile、ditinct、
first、reduce
本文深入解析Spark中的Transformation、Action、Shuffle算子,包括union、reduceByKey、groupBy、join等核心算子的功能与应用场景,以及它们如何触发Job和Stage划分。
612





