Hadoop1.0与Hadoop2.0的区别

最新推荐文章于 2024-03-08 18:56:45 发布

原创

最新推荐文章于 2024-03-08 18:56:45 发布 · 797 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

Hadoop1.0的局限性在于NameNode的单点故障和拓展性问题，以及MapReduce的资源浪费和仅支持简单编程模型。Hadoop2.0通过HDFS Federation和高可用HA解决了NameNode问题，引入Yarn解决了MapReduce的不足，支持更多计算模型，提高了可拓展性和性能。

1.Hadoop概述

　　在Google三篇大数据论文发表之后，Cloudera公司在这几篇论文的基础上，开发出了现在的Hadoop。但Hadoop开发出来也并非一帆风顺的，Hadoop1.0版本有诸多局限。在后续的不断实践之中，Hadoop2.0横空出世，而后Hadoop2.0逐渐成为大数据中的主流。那么Hadoop1.0究竟存在哪些缺陷，在它升级到Hadoop2.0的时候又做出了怎样的调整，最终使得Hadoop2.0成为大数据的基石呢？

2.Hadoop1.0

　　首先我们来看hadoop1.0的整体结构。在hadoop1.0中有两个模块，一个是分布式文件系统HDFS(Hadoop Distrbuted File System)。另一个则是分布式计算框架MapReduce。我们分别来看看这两个模块的架构吧。

2.1　HDFS1.0

　　对HDFS来说，其主要的运行架构则是master-slave架构，即主从架构。其中呢，master主节点称之为Namenode节点，而slave从节点称为DataNode节点。

这个NameNode的职责是什么呢？

１、NameNode管理着整个文件系统，负责接收用户的操作请求

２、NameNode管理着整个文件系统的目录结构，所谓目录结构类似于我们Windows操作系统的体系结构

３、NameNode管理着整个文件系统的元数据信息，所谓元数据信息指定是除了数据本身之外涉及到文件自身的相关信息

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。