使用Python编写第一个MapReduce程序 演示目标 演示环境 编写MR 编写mapper 编写reducer 部署MR 上传python文件到服务器 编写Sheel脚本 运行MR 演示目标 编写一个MapReduce,用于计算文章中所有词语的出现次数(WordCount)。 演示环境 基于Hadoop2.6.5; 完整环境请参考以下两篇博客: 从0开始搭建Hadoop2.x高可用集群(HDFS篇) 从0开始搭建Hadoop2.x高可用集群(YARN篇) 上传MR计算所用的文章到HDFS中; 编写MR 编写mapper和reducer所需的python文件 编写mapper #!/usr/bin/evn python # -*- coding: UTF-8 -*- # @author NickZx # @date 2019/7/31 13:58 import sys for line in sys.stdin: words = line.strip().split(' '