【hadoop】yarn基本架构和工作机制

最新推荐文章于 2022-04-25 10:57:37 发布

转载最新推荐文章于 2022-04-25 10:57:37 发布 · 396 阅读

文章标签：

#hadoop #yarn

大数据专栏收录该内容

8 篇文章

订阅专栏

本文详细介绍了YARN的基本架构与工作机制，包括程序提交流程、资源管理、任务调度等关键环节，帮助读者理解YARN如何高效地管理和调度计算资源。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、yarn基本架构

二、yarn工作机制

（0）Mr 程序提交到客户端所在的节点。

（1）Yarnrunner 向 Resourcemanager 申请一个 Application。

（2）rm 将该应用程序的资源路径返回给 yarnrunner。

（3）该程序将运行所需资源提交到 HDFS 上。

（4）程序资源提交完毕后，申请运行 mrAppMaster。

（5）RM 将用户的请求初始化成一个 task。

（6）其中一个 NodeManager 领取到 task 任务。

（7）该 NodeManager 创建容器 Container，并产生 MRAppmaster。

（8）Container 从 HDFS 上拷贝资源到本地。

（9）MRAppmaster 向 RM 申请运行 maptask 资源。

（10）RM 将运行 maptask 任务分配给另外两个 NodeManager，另两个 NodeManager 分

别领取任务并创建容器。

（11）MR 向两个接收到任务的 NodeManager 发送程序启动脚本，这两个 NodeManager

分别启动 maptask，maptask 对数据分区排序。

（12）MrAppMaster 等待所有 maptask 运行完毕后，向 RM 申请容器，运行 reduce task。

（13）reduce task 向 maptask 获取相应分区的数据。

（14）程序运行完毕后，MR 会向 RM 申请注销自己。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

InnerPeace_

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【HADOOP】浅谈Yarn的工作机制

SmallScorpion

12-19

1018

浅谈Yarn的工作机制

Hadoop面试题---Yarn的作用以及工作机制

qq_39872456的博客

02-13

7096

一、Yarn的作用在大数据生态环境中，yarn主要有两个作用：资源管理和程序调度。二、Yarn的组成主要由ResourceManager、NodeManager、ApplicationMaster 和 Container 等组件构成。三、Yarn的基础架构（1）ResourceManager作用： 1）处理客户端请求；2）监控NodeManager，对各个NodeManager上的资源进行统一管理和调度；3）给ApplicationMaster分配空闲的Container运行并监控其运行状态；

参与评论您还未登录，请先登录后发表或查看评论

Hadoop Yarn 框架原理及运作机制

热门推荐

hello

01-30

5万+

1.1 YARN 基本架构 YARN是Hadoop 2.0中的资源管理系统，它的基本设计思想是将MRv1中的JobTracker拆分成了两个独立的服务：一个全局的资源管理器ResourceManager和每个应用程序特有的ApplicationMaster。其中ResourceManager负责整个系统的资源管理和分配，而ApplicationMaster负责单个应用程序的管理。

Hadoop Yarn工作机制

雾幻的博客

04-12

397

在yarn上写应用程序并不同于我们熟知的MapReduce应用程序，必须牢记yarn只是一个资源管理的框架，并不是一个计算框架，计算框架可以运行在yarn上。我们所能做的就是向RM申请container,然后配合NM一起来启动container。就像MRv2一样，jobclient请求用于MR AM运行的container，设置环境变量和启动命令，然后交由NM去启动MR AM，随后map/re...

Hadoop Yarn 的基本架构以及工作机制分析

weixin_35792948的博客

04-28

440

Hadoop Yarn 学习之路01 本文目的：在对Hadoop yarn进行源码分析之前，我们首先要搞懂它的基本架构，然后根据它的架构理解它的运作流程和工作机制，本文首先对其架构进行解读，然后分析它的具体工作流程。 Yarn 的基本架构 Yarn作为Hadoop 2.0的资源管理系统，和Hadoop 1.0不同的是，Yarn把全局的资源管理和应用程序的管理进行了分离。资源管理：Res...

Hadoop之Yarn的工作机制

weixin_43586713的博客

11-04

969

YARN主要由 ResourceManager、 NodeManager、 ApplicationMaster和 Container等组件构成。 YARN工作机制（1）MR 程序提交到客户端所在的节点。（2）YarnRunner 向ResourceManager 申请一个Application。（3）RM 将该应用程序的资源路径返回给YarnRunner。（4）该程序将运行所需资源提交到HDFS 上。（5）程序资源提交完毕后，申请运行mrAppMaster。（6）RM 将用户的请求初始化成一个T

Hadoop YARN 基本架构和发展趋势 - d.pdf

10-16

4. **资源隔离和细粒度调度**：为了更好地支持不同应用的需求，YARN正在发展更加精细的资源隔离机制和更灵活的调度策略。【总结】 Hadoop YARN的出现是为了解决Hadoop 1.x时代的局限性，通过分离资源管理和计算...

Hadoop YARN 基本架构和发展趋势

12-24

随着大数据技术的发展，YARN架构也在不断地演化和优化。发展趋势包括更好地资源隔离和安全策略、持续优化的资源调度器以及对动态资源调整的更加灵活支持。Hadoop YARN作为大数据生态中的重要组成部分，它的演进将...

YARN 基础架构，工作机制，任务调度器

03-31

YARN 基础架构、工作机制、任务调度器 YARN（Yet Another Resource Negotiator）是 Hadoop 2.0 中的资源管理系统，它的设计思想是将 MRv1 中的 JobTracker 拆分成两个独立的服务：一个全局的资源管理器 ...

YARNRunner.java

10-18

hadoop本地模式执行依赖的类YARNRunner.java，安全无病毒，放心可使用！

NativeIO和YARNRunner修改后的源码

10-27

用eclipse本地提交Hadoop任务（如WordCount）到服务器上跑的时候，会报错： Stack trace: ExitCodeException exitCode=1: at org.apache.hadoop.util.Shell.runCommand(Shell.java:538) at org.apache.hadoop.util.Shell.run(Shell.java:455).... 这是hadoop本身的一个bug，可以通过修改NativeIO和YARNRunner的源码并替换解决。这是这两个.java的zip包。

<hadoop>YARN运行机制

huahai_nb的博客

02-19

390

Hadoop 的 YARN 管理方式

【Hadoop】07-YARN运行机制

通往神秘的道路的专栏

04-29

744

YARN是Hadoop的集群资源管理系统。YARN被引入Hadoop2，最初是为了改善MapReduce的实现，但它具有足够的通用性，同样可以支持其他的分布式计算模型。YARN提供请求和使用集群资源的API，但这些API很少直接用于用户代码。相反用户代码中用的是分布式计算框架提供的更高层API，这些API建立在YARN之上且向用户隐藏了资源管理细节。还有一层应用是建立在上图框架之上。如Pig，Hi...

hadoop yarn的原理和工作流程

qq_35710240的博客

04-03

1802

之前写过 mapreduce的原理和工作流程，包括了一小部分yarn的内容，因为yarn本来就是从mrv1中提出来的，所以二者有千丝万缕的联系，另外，作为一个新手也在梳理的阶段，所以记录的内容或多或少会有混乱或者不精准，还请大家包涵。结构如下：先简要介绍一下mrv1中的资源管理，然后概述yarn。一，mrv1 这个阶段资源管理和计算都是由mapreduce独自完成。执行阶段包括：ma...

YARNRunner的运行原理总结

zhouxucando的博客

10-25

961

之前看了那么些源码，大致对整个Yarn的运行过程有了一个了解，总结一下首先每个Yarn集群都有一个Resource Manager 以及若干个NodeManager Resource Manager主要有两个对象，一个就是Scheduler，还有一个就是Applications Manager ASM Scheduler有FIFO和Fair等，主要作用就是根据Node...

YARN的执行流程

CyAurora的博客

08-01

1271

在MR程序运⾏时，有五个独⽴的进程： 1.YarnRunner:⽤于提交作业的客户端程序 2.ResourceManager:yarn资源管理器，负责协调集群上计算机资源的分配 3. NodeManager:yarn节点管理器，负责启动和监视集群中机器上的计算容器（container） 4.Application Master:负责协调运⾏MapReduce作业的任务，他和任务都在容器中运⾏，这些容由资源管理器...

Hadoop中Yarnrunner里面submit Job以及AM生成至Job处理过程源码解析

l290781453的专栏

07-04

1421

参考了一篇文章，才看懂了Yarnrunner的整个流程： http://blog.youkuaiyun.com/caodaoxi/article/details/12970993 网上很多文章写的不是很清楚，有些到AM的启动的时候就错了，结合最近俩星期看的Yarnrunner部分的源码我把我的理解写下来，打算分三部分上： SubmitJob到schduler为Application

Yarn 资源调度器概述

liudachu的博客

04-25

1267

Yarn资源调度器概述思考： 1）如何管理集群资源？ 2）如何给任务合理分配资源？ Yarn是一个资源调度平台，负责为运算程序提供服务器运算资源，相当于一个分布式的操作系统平台，而MapReduce等运算程序则相当于运行于操作系统之上的应用程序。 1、Yarn基础架构 Yarn主要由ResourceManager、NodeManager、ApplicationMaster和Container等组件构成。 2、Yarn工作机制（1）MR程序提交到客户端所在的节点。（2）Ya

Hadoop YARN Federation 工作原理和机制详解

最新发布

07-23

<think>嗯，用户想了解Hadoop YARN Federation的架构和工作机制。这个问题需要深入解释分布式系统的设计思想。用户可能是个大数据工程师或者学生，正在研究YARN的扩展方案。从技术角度看，YARN Federation的核心是解决单点瓶颈问题。我记得Hadoop在早期版本中，ResourceManager是单点运行的，当集群规模扩大到上万节点时，这会导致性能问题。Federation通过引入多个ResourceManager实例来分担负载，这个设计思路和HDFS Federation很像。需要重点解释几个关键组件：Router、StateStore和PolicyManager。Router相当于客户端请求的入口点，它根据策略将请求转发给不同的RM；StateStore负责维护集群状态的一致性；PolicyManager则决定了路由逻辑。这三者协同工作才能实现透明的联邦机制。用户可能还会关心实际部署问题。比如Router的高可用配置、StateStore的选型（Zookeeper还是其他方案）、跨机房部署时的延迟问题等。不过用户当前的问题集中在工作机制上，这些实操细节可以放在后续问题里。考虑到用户要求详细解释，准备从架构图开始说明，然后分步骤描述请求处理流程。特别要强调"无单点故障"和"线性扩展"这两个核心优势，这对大规模集群非常重要。用户提供的引用材料里提到Federation不能解决MapReduce性能问题，这个观点是对的。在回答里需要明确区分YARN资源管理和计算框架性能的关系，避免产生误导。最后要注意技术术语的中文翻译准确性，比如"Sub-Cluster"译为"子集群"比"分集群"更准确，"State Store"译为"状态存储"而非"状态仓库"。</think>以下是Hadoop YARN Federation的架构与工作机制详解： ### **1. 核心目标** 解决单一ResourceManager（RM）的扩展性瓶颈： - **单点故障风险**：传统架构中RM是单点故障源 - **资源限制**：单个RM难以管理超大规模集群（>10K节点） - **性能瓶颈**：高并发场景下调度吞吐量受限 ### **2. 架构组件** ```mermaid graph LR Client-->Router Router-->|路由策略| RM1[RM Sub-Cluster1] Router-->|路由策略| RM2[RM Sub-Cluster2] RM1-->|状态同步| StateStore[(全局状态存储)] RM2-->|状态同步| StateStore ``` #### **关键组件说明** | **组件** | **功能** | |--------------------|--------------------------------------------------------------------------| | **Router** | 客户端请求入口点，实现请求的透明路由（无感知转发） | | **Sub-Cluster** | 独立RM实例+NodeManager组，每个子集群管理专属物理资源 | | **StateStore** | 全局状态存储（通常用ZooKeeper），维护集群拓扑和策略 | | **PolicyManager** | 决策路由策略（如基于队列/用户/负载） | ### **3. 工作流程** #### **(1) 客户端提交作业** ```python # 客户端代码示例（无感知调用） app = yarn_client.submit_app( app_name="federation_demo", resource_request={"memory": "4GB", "vcores": 2} # 资源请求格式不变 ) ``` #### **(2) Router路由决策** 根据策略选择目标子集群： - **策略类型**： - 哈希路由（HashRouterPolicy）：$hash(user) \mod N$ - 负载均衡（LoadBasedRouterPolicy）：$min(rm_i.load), i\in[1,N]$ - 队列映射（QueueBasedPolicy）：$queue \rightarrow rm_id$ #### **(3) 子集群处理** ```mermaid sequenceDiagram RM->>NM: 分配容器 NM->>RM: 心跳报告 RM->>StateStore: 同步状态(作业进度/资源变更) ``` #### **(4) 全局状态同步** - **StateStore维护**： - 子集群活跃状态 - 路由策略版本 - 跨集群队列配额 - 容错机制：若子集群故障，Router自动屏蔽故障节点 ### **4. 关键技术机制** #### **资源隔离与共享** - **物理隔离**：每个NM固定归属一个子集群 - **逻辑统一**：通过Router提供全局资源视图 - **跨集群调度**：需通过`FederationInterceptor`组件实现（实验性特性） #### **容错设计** - **Router HA**：多Router实例+负载均衡器 - **状态存储冗余**：StateStore采用ZooKeeper集群 - **子集群自治**：单个子集群故障不影响其他集群 ### **5. 性能优化效果** $$ T_{max} = \sum_{i=1}^{N} T_{rm_i} \quad (N=\text{子集群数}) $$ - 调度吞吐量线性扩展（实测可达**10倍**提升）[^1] - 支持**百万级**容器并发管理 - 降低单RM GC压力（各子集群独立GC） ### **6. 典型部署场景** ```bash # 配置文件示例（yarn-site.xml） <property> <name>yarn.federation.router.policy</name> <value>org.apache.hadoop.yarn.server.router.HashBasedRouterPolicy</value> </property> <property> <name>yarn.federation.state-store.zk.address</name> <value>zk1:2181,zk2:2181</value> # ZooKeeper集群地址 </property> ``` > **注意**：Federation虽提升扩展性，但增加了运维复杂度，需权衡集群规模与运维成本[^1]。对于中小集群（<5K节点），建议优先优化RM配置而非引入联邦。 --- **