Spark中Standalone的两种提交模式(Standalone-client模式与Standalone-cluster模式)

本文详细介绍了Spark在Standalone部署模式下的client和cluster提交方式。client模式下,Driver在客户端启动,适合测试,但在生产环境中可能导致网卡流量激增。而cluster模式则将Driver放在Worker节点上,适用于生产环境,能有效分散流量。在cluster模式下,应用的所有依赖必须在所有worker节点上可用或预先打包。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


Spark中Standalone有两种提交模式,一个是Standalone-client模式,一个是Standalone-cluster模式。

1.Standalone-client提交任务方式

提交命令:

./spark-submit --master  spark://node01:7077 --class org.apache.spark.examples.SparkPi  ../lib/spark-examples-1.6.
0-hadoop2.6.0.jar 100

解释:–class org.apache.spark.examples.SparkPi main函数

在这里插入图片描述

执行流程
  1. client模式提交任务后,会在客户端启动Driver进程。
  2. Driver会向Master申请启动Application启动的资源。
  3. 资源申请成功,Driver端将task发送到worker端执行。
  4. worker将task执行结果返回到Driver端。(由代码设置)
总结
  1. client模式适用于测试调试程序。Driver进程是在客户端启动的,这里的客户端就是指提交应用程序的当前节点。在Driver端可以看到task执行的情况。生产环境下不能使用client模式,是因为:假设要
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值