将Spark Application提交运行到YARN集群上,至关重要,企业中大多数都是运行在YANR上,文档:launching-spark-on-yarn
spark on yarn 模式官方文档说明:
running-on-yarn
running-on-yarn#configuration
同时注意,如果我们的spark程序是运行在yarn上面的话,那么我们就不需要spark 的集群了,我们只需要找任意一台机器配置我们的spark的客户端提交任务到yarn集群上面去即可。
1. 属性配置
当Spark Application运行到YARN上时,在提交应用时指定master为yarn即可,同时需 要告知YARN集群配置信息(比如ResourceManager地址信息),此外需要监控Spark Application,配置历史服务器相关属性。
本文详细介绍了如何将Spark Application提交到YARN集群上,包括设置环境变量、配置历史服务、提交应用以及解决整合Spark历史服务器的问题。重点讨论了在YARN上配置Spark的属性,如设置Master为yarn,配置HistoryServer地址,以及优化提交应用时的资源检查和依赖jar包。同时,还提供了启动服务和查看应用状态的步骤。
订阅专栏 解锁全文
2356

被折叠的 条评论
为什么被折叠?



