【1.1】spark on yarn 模式

本文详细解析了在YARN集群管理模式下,Spark任务的两种执行模式:yarn-client与yarn-cluster。yarn-client模式下,Driver运行在客户端,通过ApplicationMaster在集群中启动Executor执行任务;yarn-cluster模式则将Driver分散在集群节点运行,减轻网络流量,但牺牲了任务执行的可见性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、基于yarn-client模式

(1)Hadoop集群启动,NodeManager(NM)向ResourceManager(RM)通信,汇报各自资源,RM掌握集群资源

(2)client上提交spark应用,同时启动Driver,client向RM申请资源,启动ApplicationMaster(AM)

(3)RM在随机选择集群中的一个NM,来启动AM,AM向RM申请资源启动Executor,RM分配资源给NM启动Executor

(4)Executor通知Driver,Driver发送task给Executor,Executor执行完成,返回结果给Driver

2、基于yarn-cluster模式

yarn-cluste和yarn-client不同的是,client提交任务后,不会再启动Driver,而是RM在集群中找一台节点,即NM上启动Driver,把Driver分散在集群节点中运行,这样避免了client上提交多个任务而引起的网络流量激增问题。client上没有Driver 进程,也看不到task执行情况,以及接收不到输出结果。
--------------------- 
作者:未知的风fly 
来源:优快云 
原文:https://blog.youkuaiyun.com/lzxlfly/article/details/80979144 
版权声明:本文为博主原创文章,转载请附上博文链接!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值