参考地址:http://spark.apache.org/docs/1.5.2/job-scheduling.html#configuration-and-setup
1.配置hadoop/etc/yarn-site.xml
- <property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle,spark_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.spark_shuffle.class</name>
<value>org.apache.spark.network.yarn.YarnShuffleService</value>
</property>
- <!-- 默认端口号 -->
- <property>
<value>7337</value>
</property>
2.拷贝spark-xxx-yarn-shuffle.jar到指定目录
拷贝spark-xxx-yarn-shuffle.jar到 hadoop/share/hadoop/yarn/里面
3.配置spark-default.conf
spark.shuffle.service.enabled true
spark.shuffle.service.prot 7337
Dynamic Allocation
| Property Name |
|---|

本文档介绍了如何在Yarn上配置Spark以实现动态资源分配。主要步骤包括:在hadoop的yarn-site.xml中配置aux-services,添加spark_shuffle服务;将spark-xxx-yarn-shuffle.jar拷贝到指定目录;在spark-default.conf中启用shuffle服务并设置端口;最后重启Yarn服务以应用配置。
最低0.47元/天 解锁文章
3622

被折叠的 条评论
为什么被折叠?



