- 当在YARN上运行Spark作业,每个Spark executor作为一个YARN容器运行。Spark可以使得多个Tasks在同一个容器里面运行。
以下参数配置为例子
spark-submit
--master yarn-cluster / yarn-clien
本文介绍了如何在YARN上运行Spark作业,重点在于理解executor与YARN容器的关系,以及如何配置参数以优化性能。关键参数包括:使用`yarn-cluster`或`yarn-client`模式,设置executor数量、每个executor的核数和内存大小,以及driver的内存。优化要点包括考虑executor数量、总vcores和内存分配的计算公式。
以下参数配置为例子
spark-submit
--master yarn-cluster / yarn-clien
2219

被折叠的 条评论
为什么被折叠?