1、启动已经搭建好的hdfs集群:start-dfs.sh
2、打开web端http://www.fxb1:50070/
3、将事先写好的mapreducer打成jar包
代码部分
Mapper部分
reducer部分
main主类
4、打jar包
5、上传到集群运行
(1)上传要处理的数据a.txt b.txt
hadoop fs -put a.txt /user/fxb1/input/
hadoop fs -put b.txt /user/fxb1/input/
(2)上传jar包
hadoop jar test.jar input output(input–>未处理数据存放位置,output处理后数据存放位置)
(3)查看结果(略)
WordCount的MapReduce用法
最新推荐文章于 2023-05-05 22:14:43 发布