编写环境
hadoop-2.6.5
python-2.7.5
xshell连接
金山云平台,一台master,3台selvet
数据类型
g 445
a 1117
b 222
c 333
d 444
e 123
f 345
h 456
map.py
1 #!/usr/bin/env python
2 import sys
3 list1=[]
4 for line in sys.stdin:
5 line=line.strip()
6 words = line.split("\n")
7 list1.append(words[

本文介绍了在Hadoop 2.6.5环境中,使用Python 2.7.5编写MapReduce程序进行字典值排序的步骤。涉及map.py和reducer.py的编写,以及遇到的常见错误及其解决方案,如文件编码、换行符、Python解释器路径等问题。同时,提供了Hadoop Streaming的jar包位置和运行命令的注意事项。
最低0.47元/天 解锁文章
1428

被折叠的 条评论
为什么被折叠?



