Hadoop集群下跑.py文件（入门wordcount）

最新推荐文章于 2021-09-27 15:40:20 发布

弥野月亮

最新推荐文章于 2021-09-27 15:40:20 发布

阅读量375

点赞数

分类专栏：数据分析

本文链接：https://blog.youkuaiyun.com/weixin_40650422/article/details/100099980

版权

数据分析专栏收录该内容

12 篇文章

订阅专栏

hadoop jar /export/servers/hadoop-2.7.4/share/hadoop/tools/lib/hadoop-streaming-2.7.4.jar -D stream.non.zero.exit.is.failure=false \
-file /export/servers/hadoop-2.7.4/test/code/mapper.py \
-mapper /export/servers/hadoop-2.7.4/test/code/mapper.py \
-file /export/servers/hadoop-2.7.4/test/code/reduce.py \
-reducer /export/servers/hadoop-2.7.4/test/code/reduce.py \
-input /user/root/hdfs_in/wordcount.txt \
-output /user/root/hdfs_out12

需要注意的点：