- 博客(4)
- 收藏
- 关注
原创 Spark RDD方法实操
创建rdd4,先用filter()方法过滤去除100以下的数据,再用distinct()方法去重输出。创建g_rdd1,用groupByKey()方法对具有相同的值进行分组,将相同键的值的数量输出。创建rdd6,先用distinct()方法去重,再用cartesian()方法输出笛卡尔积。创建rdd1与rdd2,用union()方法合并rdd1与rdd2放在rdd3中。创建rdd1与rdd2,用union()方法合并rdd1与rdd2放在rdd4中。用textFile()方法将文件内容创建为rdd。
2024-04-01 17:48:33
1657
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人