将函数应用于 RDD 中的每个元素,将返回的迭代器的所有内容构成新的 RDD。通常用来切分单词
flatmap 输入是一输出是多
直接上代码
输入是文件 文件内容是
flume sd hadoop hbase kylin hdfs hadoop sd sd flume hdfs
String logFile = "D:\\ab.txt";
SparkConf conf = new SparkConf().setMaster("local").setAppName("TestSpark");
JavaSparkContext sc = new JavaSparkContext(conf)

本文介绍了 Spark Java 中的 flatMap 算子,该算子用于将RDD的每个元素应用函数并返回一个新的RDD,其中包含原始元素经过函数处理后的所有结果。示例展示了如何将含有重复单词的文件内容,通过 flatMap 切割成单独的单词。
最低0.47元/天 解锁文章
1539

被折叠的 条评论
为什么被折叠?



