1、交并集、笛卡尔积 val rdd1: RDD[Int] = sc.parallelize( List( 1,2,3,4,5) ) val rdd2: RDD[Int] = sc.parallelize( List( 3,4,5,6,7) ) -- 并集:union操作;union操作只是将2个RDD合并成一个,并没有发生数据计算 -- 并集是窄依赖(one to one deps) rdd1.union(rdd2).foreach(<