Apache Hadoop 2.x的改进概述

Hadoop 2.x 相对于 Hadoop 1.x 在 HDFS 和 MapReduce 方面进行了重大升级。HDFS 引入了联合机制,允许通过多个独立的名字节点来水平扩展名称服务。MapReduce 采用 YARN 架构,分离了资源管理和作业生命周期管理功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Apache Hadoop 2.x的改进概述

Apache Hadoop 2.xconsists of significant improvements over the previous stable release(hadoop-1.x).

相对于Hadoop 1.x的稳定版本,Hadoop 2.x提供了如下重大改进。

Here is a shortoverview of the improvments to both HDFS and MapReduce.

下面简单介绍一下在HDFS和MapReduce方面的改进。

In order to scale thename service horizontally, federation uses multiple independentNamenodes/Namespaces. The Namenodes are federated, that is, the Namenodes areindependent and don't require coordination with each other. The datanodes areused as common storage for blocks by all the Namenodes. Each datanode registerswith all the Namenodes in the cluster. Datanodes send periodic heartbeats andblock reports and handles commands from the Namenodes.

为了水平扩展,HDFS联合中使用多个互相独立的Namenodes。多个Namenodes联合在一起,即Namenodes之间互相独立且无需彼此协调。Datanodes可以为所有的Namenodes使用,以存储数据块。每个Datanode都在集群中的所有Namenodes上注册。Datanode向所有的Namenodes发送心跳信息和数据块列表信息,并响应Namenodes发回的命令。

The new architectureintroduced in hadoop-0.23, divides the two major functions of the JobTracker:resource management and job life-cycle management into separate components.

hadoop-0.23开始使用的新MapReduce架构中,将JobTracker分为“资源管理”和“Job生命周期管理”两个独立的组件。

The newResourceManager manages the global assignment of compute resources toapplications and the per-application ApplicationMaster manages the application‚Äôs scheduling and coordination.

ResourceManager组件负责管理计算资源对所有应用的全局分配。

而每个应用都有的ApplicationMaster则负责管理应用内部的调度和协调。

An application iseither a single job in the sense of classic MapReduce jobs or a DAG of suchjobs.

一个应用要么是传统MapReduce概念上的一个Job,要么是Job的一个DAG。

The ResourceManagerand per-machine NodeManager daemon, which manages the user processes on thatmachine, form the computation fabric.

唯一的ResourceManager和每个机器上都有的NodeManager守护进程,一起形成了计算设施。其中,NodeManager负责管理所在机器上的用户进程。

The per-applicationApplicationMaster is, in effect, a framework specific library and is taskedwith negotiating resources from the ResourceManager and working with theNodeManager(s) to execute and monitor the tasks.

每个应用都有的ApplicationMaster是一个框架相关的类库,负责与ResourceManager协调资源,并与NodeManager(s)一起负责执行和监控Task。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值