Spark submit 提交任务（四）

最新推荐文章于 2024-07-10 08:00:00 发布

RivenDong

最新推荐文章于 2024-07-10 08:00:00 发布

阅读量1.2k

点赞数

分类专栏：大数据 # Spark

本文链接：https://blog.youkuaiyun.com/rivendong/article/details/107185217

版权

大数据同时被 2 个专栏收录

91 篇文章

订阅专栏

Spark

10 篇文章

订阅专栏

本文介绍如何使用spark-submit命令提交Spark应用作业至集群，包括参数解析与操作流程，并概述了Spark的基础命令与开发工具，如Spark-shell及IDE选择。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

Spark基于应用作业的操作
Spark操作的基础命令与开发工具介绍

Spark基于应用作业的操作

Spark框架可借助spark-submit来提交一个编写好的Job应用到集群，从而完成Spark应用的分析和处理，这通常是生产场景中使用的一种操作方式。

spark-submit --class org.apache.spark.examples.JavaSparkPi --master spark://master002:7077 ../examples/jars/spark-examples_2.11-2.4.3.jar 1

在这里插入图片描述

注释：

–class 参数用于指定提交的JAR包中的运行主类
最后一个数字1代表运行的slices数量（即并行度），每一个slice都将启动一个Task来运行，每一个Task任务对应一个JVM进程
.jar 是提交到Spark集群的Job作业打包JAR，这与Hadoop提交作业的方式是相同的

Spark操作的基础命令与开发工具介绍

在Spark的安装目录下的bin目录中有以下两个运行命令

Spark-submit：该命令用于提交Spark的Job应用，通常用于测试
Spark-shell：Spark交互式命令行工具，通常用于生产环境

开发Spark应用可使用IDEA或Eclipse

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

RivenDong

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Spark源码系列（五）Spark Submit任务提交

JKerving的博客

07-31

957

Spark源码系列：Spark Submit任务提交文章目录Spark源码系列：Spark Submit任务提交客户端任务提交源码解析org.apache.spark.deploy.SparkSubmit总结前面几篇文章讲的是DAGScheduler，分析的是spark任务提交后的Stage划分。一开始没有想到按照整体任务提交的流程去写系列源码文章，所以还是写博客经验有所欠缺呀。那么从这篇文章开始我们从Spark任务提交开始，研究Spark内部是如何运行的，Spark任务是如何从开始运行到结束的。 Sp

如何使用spark-submit提交sparkSQL任务

vic_torsun的博客

08-27

1万+

前言本文介绍了使用java开发spark sql应用程序提交到yarn上运行的全过程，并介绍解决了一些开发和提交中常见的问题。准备首先我们要搭建好spark on yarn的集群环境，我是用cdh安装和cloudera manager进行维护的。这里用到的组件主要有yarn、hdfs和hive。对于开发人员来说唯一要准备的就是代码开发环境，使用idea创建一个maven项目，在pom....

参与评论您还未登录，请先登录后发表或查看评论

spark-submit 提交任务及参数说明

weixin_33816946的博客

12-20

662

spark-submit 可以提交任务到 spark 集群执行，也可以提交到 hadoop 的 yarn 集群执行。 1. 例子一个最简单的例子，部署 spark standalone 模式后，提交到本地执行。 ./bin/spark-submit \ --master spark://localhost:7077 \ examples/src/main/python/pi.py...

Spark提交任务

别人笑我太疯癫，我笑他人看不穿。

11-02

4110

Spark_Submit脚本参数 Spark-submit脚本提交任务时最简易的命令格式如下： ./bin/spark-submit \ --master spark://localhost:7077 \ 任务包任务参数而实际开发中用的一般是如下的格式 ./bin/spark-submit \ --master yarn \ --deploy-mode cluster \ --driver-memory 1g \ --executor-memory 1g \ --executor-cores 11

Spark任务提交

m0_51550513的博客

05-08

297

【代码】Spark任务提交。

Spark---Master启动及Submit任务提交

yaya_jn的博客

11-27

1773

Spark集群启动之后，首先调用$SPARK_HOME/sbin/start-all.sh，start-all.sh脚本中调用了“start-master.sh”脚本和“start-slaves.sh”脚本，在start-master.sh脚本中可以看到启动Master角色的主类：“org.apache.spark.deploy.master.Master”。每个角色启动之前首先向NettyRpcEnv环境中注册对应的Endpoint，然后启动。

Spark提交任务参数全面解析

weixin_42326851的博客

07-10

4610

Spark提交任务参数全面解析

Spark-submit

03-14

hdp spark

Spark-submit提交任务如何读取外部配置文件

mjjyszazc的博客

01-05

2991

Spark-submit的--files参数

spark-submit提交任务参数解析

Jerry的博客

11-13

2524

导读：spark和yarn整合后，可以将Application提交到Yarn上运行，和StandAlone提交模式一样，Yarn也有两种提交模式。具体： 1. yarn-client提交任务配置：在spark目录下的spark-env.sh添加Hadoop_HOME的配置目录即可提交yarn 任务，具体步骤如下： export HADOOP_CONF_DIR=$HADOOP_...

Spark2.0.2源码分析——SparkSubmit提交任务

myllxy

01-31

1225

序列图： 1.客户端任务提交： ./spark-submit --master spark://node1:7077 --deploy-mode cluster --class org.apache.spark.examples.SparkPi ../examples/jars/spark-examples_2.11-2.4.0.jar 100 其中 spark - submit 脚...

【Spark系列6】spark submit提交任务

安全曼巴2020

08-29

675

根据spark官网，在提交任务的时候指定–jars，用逗号分开。这样做的缺点是每次都要指定jar包，如果jar包少的话可以这么做，但是如果多的话会很麻烦。 spark-submit --master yarn-client --executor-memory 3g --executor-cores 2 --num-executors 2 --jars ***.jar,***.jar(你的jar包

spark提交任务命令

weixin_44280356的博客

10-21

4158

Spark submit spark-submit 可以提交任务到 spark 集群执行，也可以提交到 hadoop 的 yarn 集群执行。 spark 提交到 yarn 执行的例子如下。 spark-submit --master yarn --executor-memory 20G --executor-cores 2 --driver-memory...

spark-submit提交任务的方式

最初の夢

12-08

1万+

submit spark jobs

使用spark-submit工具提交Spark作业

需要远程指导仿真实验、代码有问题的，请后台私信或者关注公众号

07-01

4248

大数据实验教学系统使用spark-submit工具提交Spark作业对于数据的批处理，通常采用编写程序、打.jar包提交给集群来执行，这需要使用Spark自带的spark-submit工具。一般的部署策略是在一个网关机器上提交应用程序，这个机器和Worker机器部署在一个网络中（例如，Standalone模式的集群中的Master节点）。在此部署策略中，client模式更为合适，client模式中的driver直接跟spark-submit进程一起启动，spark-submit进程在此扮演集群中一个c

spark-submit

m0_37055484的博客

02-01

261

spark-submit参数详解

Spark spark-submit 提交应用程序