yarn怎样调度spark答疑

1、比如一个yarn集群:Hadoop01 ,Hadoop02 ,Hadoop03
yarn资源管理器部署在 Hadoop01 上,spark也部署在Hadoop01服务器。如果在Hadoop01 执行 spark-submit,任务会被yarn调度到其他Hadoop02或者Hadoop03执行吗?如果被调度到其他服务器那 spark应用没有执行环境

答案:会被yarn调度到其他服务器,在调度中会将 spark的运行环境和 应用一起 调度 过去,具体看一下接口证明
1.1、在Hadoop01服务器 cd /usr/local/src/app/tmp/usercache/root/filecache 文件夹下生产了三个文件夹
在这里插入图片描述
一次打开三个文件夹截图
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
1.2、在Hadoop01服务器
在这里插入图片描述
1.3、结论当给yarn的spark-submit提交应用。yarn进过计算,调度到那些服务器执行,就会将spark执行环境,配置文件,和执行的 应用 都拷贝一份到要计算的环境。执行计算

2、yarn集群在调度中执行spark-submit 都会生产缓存吗?还是如果执行相同的命令会调用之前的缓存。不会生产多余的缓存

答案:
2.1、根据观察没执行一次就会生产对应的缓存,根据yarn调度到那些服务器执行运算,就在那些服务器生成相应的缓存
如下图:我在Hadoop01执行spark-submit, 在Hadoop02,Hadoop03进行计算这,只有Hadoop02和Hadoop03生成了相应缓存
达到了设置缓存的限制会删除之前的缓存数据
Hadoop02:
在这里插入图片描述
Hadoop03:
在这里插入图片描述

3、可以结合我这篇文件针对 磁盘满的情况进行处理
https://blog.youkuaiyun.com/u012228523/article/details/124196522

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

sunnyboy_4

你的鼓励是我创作的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值