Yarn入门详解

Yarn是Hadoop2.0的资源管理系统,负责集群资源统一管理和分配。它包含ResourceManager、NodeManager和ApplicationMaster三个组件。ResourceManager的Scheduler负责应用的资源分配,提供FIFO、Capacity和Fair Scheduler策略。NodeManager管理节点资源,ApplicationMaster协调任务执行。Yarn运行流程包括Client提交Job、ApplicationMaster注册、任务分配和执行。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Yarn入门详解

一、Yarn概述

Yarn是Hadoop2.0版本引入的集群资源管理系统,直接从MR1演化而来。
在这里插入图片描述我们可以从上图看出Hadoop2.x可以支持其他的分布式计算框架,在引入Yarn的Hadoop2.x之后同一套硬件集群中可以运行多个任务,例如:MR、Spark任务等

Yarn包含三个组件:

  • ResourceManager(RM):资源管理
  • NodeManager(NM):相当于1.0中的TaskTracker的角色,接收来自RM的请求,分配Container的资源,通过心跳汇报给RM,并且管理节点内部的资源利用情况
  • ApplicationMaster(AM):任务调度

严格意义上来说,Yarn只包含两个组件,ResourceManager以及NodeManager。而ApplicationMaster只是一个Yarn的客户端

Yarn将MR1中的JobTracker的资源管理任务调度做了权力肢解,分别由ResourceManager和ApplicationMaster进程来实现

二、Yarn架构组件详解

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值