MapReduce工作流程、Yarn工作机制

本文详细解析了MapReduce的工作流程及YARN的工作机制。从客户端提交应用开始,经过ResourceManager的任务调度,到NodeManager创建Container运行任务,直至任务完成。深入理解YARN如何管理资源,协调Map和Reduce任务的执行。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、MapReduce工作流程

 

 

二、yarn的工作机制

0、MapReduce程序提交的客户端所在的节点上。

1、客户端向ResourceManager申请一个Application。

2、ResourceManager 返回一个Application资源提交的HDFS路径和Application_id。

3、客户端将运行job的资源(job.xml、job.split、wordcount.jar) 提交到对应的HDFS路径上。

4、客户端通知ResourceManager资源提交完毕,申请运行MRAppMaster。

5、ResourceMange将用户的请求初始化为一个task,这个task进入任务调度队列中等待分配资源。

6、ResourceManager将队列中的task分配给一个空闲的NodeManager。

7、这个领到task的NodeManager开始创建Container容器,并产生MRAppMaster。

8、该Container到HDFS上拷贝资源到本地。

9、MRAppMaster向ResourceManager申请运行map task的容器。

10、ResourceManager将map task分配给其他空闲的NodeManager,然后NodeManager领到map task后创建Container容器。

11、MRAppMaster向领到map task的节点发送启动脚本,这两个NodeManager分别启动map task。

12、MRAppMaster等待所有的map task执行完后,向ResourceManager申请运行Reduce task的容器。

13、ResourceManager 分配NodeManager运行Reduce task 并创建Container容器。

14、reduce task 获取map task上对应的分区数据进行操作。

15、MRAppMaster 等待所有的任务执行完后,向ResourceManager申请注销自己。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值