对Spark中Driver的小研究

程研板

已于 2022-01-26 20:17:40 修改

阅读量1.8k

点赞数 3

分类专栏： # Spark原理与优化文章标签： spark big data hadoop

于 2022-01-13 00:00:18 首次发布

本文链接：https://blog.youkuaiyun.com/qq_38258720/article/details/122464678

版权

Spark原理与优化专栏收录该内容

6 篇文章

订阅专栏

Standalone模式

client模式：

./bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master spark://hadoop000:7077 \
--deploy-mode client \
./examples/jars/spark-examples_2.11-2.4.2.jar 1000

运行的进程：

[hadoop@hadoop000 ~]$ jps
16610 CoarseGrainedExecutorBackend
15156 Worker
15062 Master
16551 SparkSubmit
16713 Jps

cluster模式：

./bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master spark://hadoop000:7077 \
--deploy-mode cluster \
./examples/jars/spark-examples_2.11-2.4.2.jar 1000

启动的进程：

开始：

[hadoop@hadoop000 ~]$ jps
16416 CoarseGrainedExecutorBackend
15156 Worker
16309 SparkSubmit
15062 Master
16348 DriverWrapper
16476 Jps

几秒后，SparkSubmit会退出，shell面板没有运行日志：

[hadoop@hadoop000 ~]$ jps
16209 CoarseGrainedExecutorBackend
15156 Worker
16276 Jps
15062 Master
16141 DriverWrapper

Yarn模式

client模式：

./bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master yarn \
--deploy-mode client \
./examples/jars/spark-examples_2.11-2.4.3.jar 1000

运行的进程：

[hadoop@hadoop000 ~]$ jps
18740 ExecutorLauncher
16949 ResourceManager
17061 NodeManager
17813 SecondaryNameNode
18021 SparkSubmit
18917 CoarseGrainedExecutorBackend
17640 DataNode
17500 NameNode
18940 Jps
18846 CoarseGrainedExecutorBackend

cluster模式：

./bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master yarn \
--deploy-mode cluster \
./examples/jars/spark-examples_2.11-2.4.3.jar 1000

运行的进程，shell面板只有完成状态的日志，没有运行结果：

[hadoop@hadoop000 ~]$ jps
21041 Jps
16949 ResourceManager
17061 NodeManager
17813 SecondaryNameNode
17640 DataNode
20777 ApplicationMaster
20026 SparkSubmit
20923 CoarseGrainedExecutorBackend
17500 NameNode
21006 CoarseGrainedExecutorBackend

详情源码下面两篇博客讲的很好：
【Spark】部署流程的深度了解
 Spark源码 —— 从 SparkSubmit 到 Driver启动