Hadoop的yarn工作机制

本文介绍Hadoop2.0中引入的Yarn资源调度平台,阐述其基本架构包括ResourceManager、NodeManager、ApplicationMaster和Container等组件,并详细解析Yarn的工作流程,从提交应用程序到运行MapReduce任务直至程序结束。

在Hadoop 2.0时代,增加了Yarn。Yarn只负责资源调度,MapReduce只负责计算。

1、Yarn概述

yarn 是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台,而 MapReduce 等运算程序则相当于运行于操作系统之上的应用程序

2、yarn的基本架构

YARN 主要由 ResourceManagerNodeManagerApplicationMaster Container 等组件构成。
         

3、Yarn的工作机制

1)、Yarn运行机制
             

2)、工作机制详解

  1. Mr 程序提交到客户端所在的节点。
  2. Yarnrunner Resourcemanager 申请一个 Application
  3. rm将该应用程序的资源路径返回给 yarnrunner
  4. 该程序将运行所需资源提交到 HDFS 上。
  5. 程序资源提交完毕后,申请运行 mrAppMaster
  6. RM 将用户的请求初始化成一个 task
  7. 其中一个 NodeManager 领取到 task 任务。
  8. NodeManager 创建容器 Container, 并产生 MRAppmaster
  9. Container HDFS 上拷贝资源到本地。
  10. MRAppmaster RM 申请运行 maptask 资源。
  11. RM 将运行 maptask 任务分配给另外两个 NodeManager, 另两个 NodeManager 分别领取任务并创建容器。
  12. MR 向两个接收到任务的 NodeManager 发送程序启动脚本, 这两个 NodeManager分别启动 maptaskmaptask 对数据分区排序
  13. MrAppMaster 等待所有 maptask 运行完毕后,向 RM 申请容器, 运行 reduce task
  14. reduce task maptask 获取相应分区的数据。
  15. 程序运行完毕后, MR 会向 RM 申请注销自己。
以上就是Yarn的工作机制详细分解,有错误还望多多指正。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值