spark on yarn的提交过程

本文详细介绍了Spark程序在YARN集群上的提交过程,包括sparkSubmit进程启动、ApplicationMaster的申请、Executor的启动和注册等关键步骤,揭示了Spark与YARN之间的交互机制。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

spark on yarn集群的提交过程

  1. 当程序提交时会启动sparkSubmit进程,里面会有解析参数对象(sparkSubmitArguments)和连接yarn的对象(yarnClusterApplication、yarnClient),连接yarn的对象连接resourceManager,请求启动ApplicationMaster
  2. resourceManager启动ApplicationMaster
  3. ApplicationMaster启动driver并且初始化sparkContext
  4. ApplicationMaster反向注册resourceManager请求资源
  5. resourceManager返回可用的资源列表
  6. ApplicationMaster启动Executor执行后台 yarnCoarseGrainedExecutorBackend(用于和yarn进行通信,启动Executor)
  7. yarnCoarseGrainedExecutorBackend向Driver反向注册
  8. Driver返回注册成功
  9. yarnCoarseGrainedExecutorBackend启动Executor

如下图:
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值