1. WordCount Examples详解
1.1 Word Count流程示意图
JavaRDD<String> textFile = sc.textFile("hdfs://...");
JavaPairRDD<String, Integer> counts = textFile
.flatMap(s -> Arrays.asList(s.split(" ")).iterator())
.mapToPair(word -> new Tuple2<>(word, 1))
.reduceByKey((a, b) -> a + b);
counts.saveAsTextFile("hdfs://...");
,
本文详细介绍了一个使用Apache Spark实现的WordCount实例。通过该实例,读者可以了解到如何将文本文件加载到Spark中,如何进行单词切分和平坦化,如何创建键值对,以及如何聚合这些键值对来统计每个单词出现的次数。
2500

被折叠的 条评论
为什么被折叠?



