Hadoop2.0与HAdoop1.0的区别:
Hadoop1.0主要由HDFS和MapReduce两个系统够长,但在Hadoop2.0中主要由 Hadoop Common、HDFS 、Hadoop YARN和Hadoop MapReduce2.0构成。
Hadoop1.0更多是在于离线的数据处理,Hadoop2.0可以支持MapReduce计算框架之外,可以支持Spark、Strom等的实时数据处理框架。

在hadoop2.0 中,YARN负责集群的资源管理,管理层的HDFS资源。MapReduce只负责数据处理,在Hadoop1.0中,MapReduce既负责数据处理,还负责资源管理的工作。










MapReduce1.0有jabTracker和TaskTracker的概念,在MapReduce2.0中没有这样的概念。
在MapReduce2.0中,由YARN负责资源调度,由MRAppMaster负责任务调度
本文探讨了Hadoop2.0与1.0的主要区别,Hadoop2.0引入了YARN和独立的MapReduce2.0,分离了资源管理和数据处理,支持实时框架如Spark和Strom。MapReduce1.0中的Tracker概念被简化,YARN负责全局调度,MRAppMaster负责任务管理。
1561

被折叠的 条评论
为什么被折叠?



