学习使用hadoop来开发
mapreduce二次排序 :需要按照value中的字段来排序,一个典型的场景是value中的数据属于多个类别,map阶段可以标示,但是无序。二次排序之后,value可以在进入reduce的时候按照不同的类别区别开,而不需要进入reduce以后再分类。 http://www.superwu.cn/2013/08/18/492
distributedcache说明 http://hadoop.apache.org/docs/stable/api/org/apache/hadoop/filecache/DistributedCache.html
迭代式mapreduce介绍:
http://hpuxtbjvip0.blog.163.com/blog/static/367413132013268442426/