1、map算子:
map是集合(RDD也可以看成为一个集合)或迭代器的方法,map里面所传函数的作用是仅仅改变集合里面装的是什么,但外面还是集合,容器是没改变的
2、flatMap算子:
flatMap方法先执行的是map(集合、迭代器来操作),再执行的flatten,flatten起作用的前提是:它之前的map操作使集合中装的元素变成了集合。因此,flatMap内部才经常搭配split使用,正是因为split操作后可以生成集合。
Spark中map算子与flatMap算子使用感悟
最新推荐文章于 2024-10-09 09:08:38 发布