Hadoop1.0存在的问题和Hadoop2.0的介绍

最新推荐文章于 2022-01-11 20:14:52 发布

龙行天下学大象

最新推荐文章于 2022-01-11 20:14:52 发布

阅读量6.4k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： hadoop1与hadoop2的区别文章标签： hadoop 云计算

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/xyz19910216/article/details/38646829

hadoop1与hadoop2的区别专栏收录该内容

1 篇文章

订阅专栏

针对Hadoop1.0中HDFS和MapReduce存在的单点故障及扩展性等问题，Hadoop2.0引入了主备NameNode机制解决HDFS单点故障问题，并通过ResourceManager和ApplicationMaster分离MapReduce资源管理和任务调度功能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Hadoop1.0在HDFS和MapReduce在高可用方面、扩展性方面存在问题

HDFS存在的问题

1.NameNode单点故障，难以应用于在线场景

2.NameNode压力过大，且内存受限，影响系统扩展性。

MapReduce存在的问题

1.JobTracker单点故障

2.JobTracker访问压力大，影响系统扩展性

3.难以支持除MapReduce之外的框架，如Spark、Storm等

Hadoop2.0解决的问题

HDFS问题

解决单点故障：通过主备NameNode解决，如果主NameNode发生故障，则切换到备NameNode

HDFS HA：1.主NameNode对外提供服务，备NameNode同步主NameNode元数据，以待切换 2.所有的DataNode同时想两个NameNode汇报数据块信息

切换方式：1.手动切换：通过命令实现主备之间的切换，可以用HDFS升级等场合 2.Zookeeper自动切换（ZookeeperFailoverController（ZKFC）：监控NameNode健康状态，并向Zookeeper注册NameNode； NameNode挂掉后ZKFC为NameNode竞争锁，获得ZKFC竞争锁的NameNode变为主NameNode）

解决内存受限问题：水平扩展，支持多个NameNode,每个NameNode分管一部分目录，所有的NameNode共享所有DataNode存储资源

MapReduce问题

Yean Hadoop2.0新引入的资源管理系统，将JobTracker的资源管理和任务调度两个功能分开，分别由ResourceManager和ApplicationMaster进程实现。

ResourceManager:负责整个集群的资源管理和调度

ApplicationMaster:负责应用程序的相关的事物,比如任务调度、任务监控和容错等

1.Yarn的引入使的多个计算框架可以运行在一个集群中，每一个应用程序对应一个ApplicationMaster

2.将MapReduce的作业直接运行在Yarn上，而不是运行在有JobTracker和TaskTRacker构建的MapReduce1.0系统上。

MapReduce2的基本功能模块：

Yarn：负责资源管理和调度

MRApplicationMaster：负责任务切分、任务调度、任务监控和容错（每一个应用程序对应一个MRAppMaster）

Map Task/ReduceTask :任务引擎，与MapReduce1.0一致

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。