发现了一个很好的python for hadoop的入门,适合没有什么hadoop基础的人学习:http://www.michael-noll.com/tutorials/writing-an-hadoop-mapreduce-program-in-python/
还有一个也是类似文档:http://cs.smith.edu/dftwiki/index.php/Hadoop_Tutorial_2_--_Running_WordCount_in_Python
下面有两个使用hadoop streaming变成的入门篇和高级篇,感觉也挺不错的:
http://dongxicheng.org/mapreduce/hadoop-streaming-programming/
http://dongxicheng.org/mapreduce/hadoop-streaming-advanced-programming/

本文提供了几个关于如何使用Python进行Hadoop编程的入门教程链接,包括基础的MapReduce程序编写及Hadoop Streaming的高级应用等,适合初学者快速上手。
937

被折叠的 条评论
为什么被折叠?



