篇简单剖析MapReduce1.0和MapReduce2.0(yarn)的工作机制。
MapReduce1.0工作原理
运行整体图

作业执行过程
关于作业的执行过程,大致分为:提交、初始化、分配任务、执行任务、更新状态、完成 这6个步骤,可以根据以上运行图,自行考虑在这个作业的执行过程中,以上4个独立的实体(客户端、JobTracker、TaskTracker、HDFS)都承担了哪些任务,进行了哪些工作,你考虑的就是对的。不信,翻翻《Hadoop权威指南》第六章验证一下吧
MapReduce2.0(Yarn)工作原理