Spark-submit提交任务到集群

最新推荐文章于 2025-07-07 22:55:56 发布

原创

最新推荐文章于 2025-07-07 22:55:56 发布 · 7.3w 阅读

13 ·

CC 4.0 BY-SA版权

文章标签：

#spark-submit

本文介绍了如何使用IntelliJ IDEA进行Spark项目打包，并通过`spark-submit`命令将任务提交到Spark集群，最后展示了运行结果。

1 IDEA 打包

示例代码参考AMPCamp2015之SparkSQL，开发环境使用idea。首先需要将程序打包成jar

选择project structure --》artifacts ，由于集群已经有了运行依赖的jar包，打包时可以将这些jar包排除出去，以减小打包后的jar包的大小。

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

kaiseu

关注关注

2
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

spark-submit 集群，提交job到集群执行

weixin_39291305的博客

11-29

311

python脚本：（get_hive_count.py） def get_total_everyDay(from_table,hive_from): spark = SparkSession.builder.master("yarn").appName("get %s hive count" % hive_from).enableHiveSupport().getOrCreate(...

【Spark】（六）任务提交(Spark Submit)

qianchun22的博客

11-16

1390

Spark 任务的提交 spark-submit的一般格式如下： bin/spark-submit [options] <app jar | python file> [app options] [options] 是要传给spark-submit 的标记列表。你可以运行spark-submit --help 列出所有可以接收的标记 <app jar | python File> 表示包含应用入口的JAR 包或Python 脚本。 [app options] 是传给你的应用的选项。

参与评论您还未登录，请先登录后发表或查看评论

大数据Spark（六十二）：Spark基于Yarn提交任务流程

Lansonli（蓝深李）的博客

07-07

2016

本文介绍了Spark在Yarn模式下提交任务的两种方式：Yarn-Client和Yarn-Cluster模式。Yarn-Client模式中，Driver运行在客户端节点，适合测试环境；Yarn-Cluster模式中，Driver作为AM运行在集群内部，适合生产环境。文章详细说明了两种模式的提交命令和执行流程，并对比了它们的特点和使用场景。Yarn-Client模式便于查看任务结果但可能导致客户端负载过高，而Yarn-Cluster模式将Driver分散在集群中，需要通过Yarn WebUI查看结果

使用spark-submit工具提交Spark作业

需要远程指导仿真实验、代码有问题的，请后台私信或者关注公众号

07-01

4350

大数据实验教学系统使用spark-submit工具提交Spark作业对于数据的批处理，通常采用编写程序、打.jar包提交给集群来执行，这需要使用Spark自带的spark-submit工具。一般的部署策略是在一个网关机器上提交应用程序，这个机器和Worker机器部署在一个网络中（例如，Standalone模式的集群中的Master节点）。在此部署策略中，client模式更为合适，client模式中的driver直接跟spark-submit进程一起启动，spark-submit进程在此扮演集群中一个c

spark-submit提交任务到集群

weixin_33906657的博客

12-09

273

2019独角兽企业重金招聘Python工程师标准>>> ...

Spark提交代码到集群中运行

加油

10-10

426

2、注意输入和输出的路径必须是HDFS存在的某个路径。3、使用maven将代码打成jar包并上传。

PySpark学习---通过spark-submit提交到yarn运行

weixin_46164667的博客

04-22

1047

Linux上提交文件命令。

Spark-submit 提交任务时与spark运行环境 jar 包冲突

weixin_43845733的博客

11-13

1659

在使用 spark-submit --master yarn 提交任务时，发生guava jar包冲突，spark-submit启动时会加载spark安装时自己的 classPath下的jar包，我使用的是 Apollo，guava-19.0.jar。 Spark ClassPath上的是guava-11.0.2.jar。因此会报 Apollo找不到方法。因此需要使用spark-sumbit --jars 将自己依赖的 guava-19.0.jar包提交到spark 执行环境中。同时–jars .

spark-submit 主要参数详细说明及Standalone集群最佳实践

日常学习与专研的记录

03-26

1606

部署提交应用到 spark 集群，可能会用到 `spark-submit` 工具，鉴于网上的博客质量残差不齐，且有很多完全是无效且错误的配置，没有搞明白诸如`--total-executor-cores` 、`--executor-cores`、`--num-executors`的关系和区别。因此有必要结合官网文档 [submitting-applications](https://spark.apache.org/docs/latest/submitting-applications.html) 详细记录

如何使用spark-submit提交sparkSQL任务

热门推荐

vic_torsun的博客

08-27

1万+

前言本文介绍了使用java开发spark sql应用程序提交到yarn上运行的全过程，并介绍解决了一些开发和提交中常见的问题。准备首先我们要搭建好spark on yarn的集群环境，我是用cdh安装和cloudera manager进行维护的。这里用到的组件主要有yarn、hdfs和hive。对于开发人员来说唯一要准备的就是代码开发环境，使用idea创建一个maven项目，在pom....

spark-submit提交集群命令

junlin1106的博客

10-24

534

简单的记录提交命令参数，先切换到spark 的bin文件夹下--master spark填写自己的spark集群，最后/home/jll/home/jll/test_word-0.0.1-SNAPSHOT.jar改成自己的jar包存放路径 ./spark-submit --name "your app name" --master spark://ctrl241:7077 --executor-

提交Spark应用程序

梁辰兴的博客

04-26

1853

提交Spark作业后，观察Spark集群管理界面，其中“Running Applications”列表表示当前Spark集群正在计算的作业，执行几秒后，刷新界面，在Completed Applications表单下，可以看到当前应用执行完毕，返回控制台查看输出信息，出现了“Pi is roughly 3.1424157120785603”，说明Pi值已经被计算完毕。除了–master参数外，spark-submit还提供了一些控制资源使用和运行时环境的参数。进入Spark安装目录。

spark程序提交到集群上_Intellij IDEA 开发Saprk程序 —— 04. 将程序提交到Spark集群...

weixin_42526087的博客

01-13

323

一. 提交前的准备：完善代码程序在本机调试成功之后，就要将其提交到Spark集群中运行。在提交之前，对代码进行简单的修改，以便提交时修改运行参数。二. 提交前的准备：生成JAR包1.点击选择菜单栏FileProject StructureArtifacts，打开“Project Sructure”窗口。2.点击“+”“JAR”“From modules with dependecies…”，打开“...

spark-submit 提交项目到spark集群运行

qq_40607631的博客

08-24

467

当在集群上运行程序时，不需要在程序中硬编码master参数，而是使用spark-submit提交应用程序并将master的URL以脚本参数的形式传入。但是，对于本地测试和单元测试，您可以通过“local[*]”来运行Spark程序（请确保本地系统中的cpu核心数够用）master是Spark，Mesos或YARN集群的URL，或者一个特殊的“local [*]”字符串来让程序以本地模式运行。添加maven的pom依赖,根据中文注释更改值。maven-package生成jar包。

spark-submit提交命令

古笑来的博客

07-19

369

spark-submit --master yarn --deploy-mode cluster --class didlib.operator.io.HbaseReader --jars scopt.jar,didlib-core.jar,guava-12.0.1.jar,protobuf-java-2.5.0.jar,hbase-server-1.2.1.jar,hbase-client-1.2.1.jar,hbase-common-1.2.1.jar,htrace-core-3.1.0-incubat

spark系列之spark-submit提交spark程序

liu_xue_xue的专栏

08-02

2204

通过spark-submit提交第一个spark 应用到集群中运行 bin/spark-submit --master spark://node-4:7077,node-5:7077 --class org.apache.spark.examples.SparkPi --executor-memory 2048mb --total-executor-cores 12 --executor-cores 1 examples/jars/spark-examples_2.11-2.2.0.jar 1000

《IDEA创建Spark工程并submit执行》

乌鸦大大

05-16

922

《windows下IDEA创建Spark工程并提交执行》IDEA创建Spark工程 IDEA创建Spark工程 1、创建时在Scala中选择IDEA项目 2、设置JAVA JDK 和Scala的JDK，其中Project SDK需要通过“New…”设置为JDK的路径；Scala SDK需要通过“Create…”设置为Scala的路径，同时命名项目 ...

spark提交任务命令

weixin_44280356的博客

10-21

4236

Spark submit spark-submit 可以提交任务到 spark 集群执行，也可以提交到 hadoop 的 yarn 集群执行。 spark 提交到 yarn 执行的例子如下。 spark-submit --master yarn --executor-memory 20G --executor-cores 2 --driver-memory...

spark-submit提交任务报错spark.shuffle.service没开启