说到入门程序,我们一定会想到刚接触C或java时控制台输出的Hello world!
在MapReduce中,入门级程序则是WordCount,计算每个单词出现的次数
首先,我们要初步的了解他的工作原理
-
我们创建测试数据
将它上传到HDFS 红框我的文件名 后面的路径是我HDFS上存储路径
在eclipse上可以看到我们上传的数据
-
上代码 请务必先看一遍源码,注释非常详细
Job类,通过Job类设置Map和Reduce设置属性,相当于一个控件,我们通过job来控制和使用MapReduceimport org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.mapreduce.lib.input.FileInputFormat; im