刚才发现一张讲解mapreduce整个工作机制图,跟大家分享一下,大家发表一下建议,对mapreduce工作机制有何看法,或者那里有不清楚。mapreduce每一个工作阶段,对我们在工作中处理某种业务都是有很大帮助的。


图中1:表示待处理数据,比如日志,比如单词计数
图中2:表示map阶段,对他们split,然后送到不同分区
图中3:表示reduce阶段,对这些数据整合处理。
图中4:表示二次mapreduce,这个是mapreduce的链式。
这里有个问题:输出的mapreduce结果,需要进入下一个mapreduce,该怎么解决?请看
“让你真正明白什么是MapReduce组合式,迭代式,链式-大数据(hadoop系列)学习-about云开发”
http://www.aboutyun.com/thread-7435-1-1.html
暂时在这里mark一下以后学完再总结
本文分享了一张关于MapReduce工作机制的图解,并邀请读者讨论MapReduce的工作流程及其在实际业务中的应用价值。文章还探讨了MapReduce链式操作的实现方式。
2063

被折叠的 条评论
为什么被折叠?



