计算文件中出现每个单词的频数。输入结果按照字母顺序进行排序。
Map过程:将文件切分,切分之后切分成单词,对每个词进行统计计数
Reduce阶段:对Map结果合并规约之后得到最终结果
案例:
1.编写WordCount.java 包含Mapper类和Reducer类
2.编译 WordCount.java javac -classpath
本文介绍使用MapReduce技术实现WordCount的基本原理与步骤。通过分解文件并统计各个单词的出现频率,最后对结果进行合并规约得到有序的统计结果。
计算文件中出现每个单词的频数。输入结果按照字母顺序进行排序。
Map过程:将文件切分,切分之后切分成单词,对每个词进行统计计数
Reduce阶段:对Map结果合并规约之后得到最终结果
案例:
1.编写WordCount.java 包含Mapper类和Reducer类
2.编译 WordCount.java javac -classpath
2796
2191
1981
2568

被折叠的 条评论
为什么被折叠?