spark on yarn idea错误: 找不到或无法加载主类org.apache.spark.deploy.yarn.ExecutorLauncher

一位不愿透露姓名的肥宅

已于 2023-02-22 11:30:58 修改

阅读量1.2k

点赞数

分类专栏： bug 文章标签： spark 大数据 intellij-idea yarn

于 2023-02-22 11:29:34 首次发布

本文链接：https://blog.youkuaiyun.com/qq_65303368/article/details/129158371

版权

bug 专栏收录该内容

20 篇文章

订阅专栏

当使用IntelliJ IDEA尝试远程提交Spark应用到YARN时，遇到找不到或无法加载主类org.apache.spark.deploy.yarn.ExecutorLauncher的错误。通过在SparkConf中设置'spark.yarn.jars'属性，指定jar包名称和依赖路径，成功解决了这个问题。尽管后续仍有其他错误，但主要的类加载问题已得到解决。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

spark on yarn idea远程提交报错，查看8088日志发现

设置sparkconf的"spark.yarn.jars"属性后解决第一个为你的jar包名称，第二个为spark依赖的jar包目录

.set("spark.yarn.jars", "C:\\Users\\han\\Desktop\\test\\dns_project\\target\\dns_project.jar,hdfs://dsy:9000/spark-yarn/jars/*.jar")

重新运行后成功解决，虽然报了其他错... 但总算找到了类

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

一位不愿透露姓名的肥宅

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

org.apache.spark.SparkException: Can only zip RDDs with same number of elements in each partition

优快云精品推荐

08-11

360

在 `Spark` 中将两个RDD使用 `zip` 函数进行拉链时出现如下问题 `org.apache.spark.SparkException: Can only zip RDDs with same number of elements in each partition`

使用idea编写spark程序并提交到yarn集群例子

光于前裕于后的博客

03-04

3807

需提前安装jdk、scala 1.创建新项目 2.增加Maven 3.修改pom.xml文件 &amp;lt;?xml version=&quot;1.0&quot; encoding=&quot;UTF-8&quot;?&amp;gt; &amp;lt;project xmlns=&quot;http://maven.apache.org/POM/4

参与评论您还未登录，请先登录后发表或查看评论

Error: Could not find or load main class org.apache.spark.deploy.yarn.ExecutorLauncher

微电子学与固体电子学-俞驰

07-22

3738

①查http://desktop:8088/cluster/scheduler 中的进度条有没有爆满，如果爆满了是上次提交的任务没清除占用空间了，先释放再说 ② cd $SPARK_HOME_HOME grep -rspark.yarn.jars conf/spark-defaults.conf:spark.yarn.jars hdfs://Desktop:9000/spark/jars/*.jar hdfs dfs -mkdir hdfs://Desktop:9000/spark hdfs dfs .

错误：找不到或加载主类 org.apache.spark.deploy.yarn.ExecutorLauncher

2301_80252580的博客

03-29

690

最后配置/usr/local/spark/conf/spark-defaults.conf 文件，配置语句为： spark.yarn.jars hdfs://master:9000/user/hadoop/jars/*.jar，其中 master为你的主机名，/user/hadoop/jars 为 jar 包在 HDFS 上的位置。解决办法：配置 spark 中的 spark-defaults.cof中的 spark.yarn.jars，配置 yarn 模式下 spark 运行的jar 包。

Could not find or load main class org.apache.spark.deploy.yarn.ApplicationMaster

南风知我意

12-26

2031

Spark on Yarn出现Could not find or load main class org.apache.spark.deploy.yarn.ApplicationMaster

spark 错误: 找不到或无法加载主类 com.atguigu.wc.BatchWordCount

weixin_51579912的博客

04-28

775

spark 错误: 找不到或无法加载主类 com.atguigu.wc.BatchWordCount

Error: Could not find or load main class org.apache.spark.deploy.yarn.ApplicationMaster

热门推荐

Alex_Sheng_Sea的博客

01-29

1万+

今天搭建了一个sparkOnYarn的集群，我想测试一下集群是否正常，使用spark自带蒙特卡罗求圆周率的算法包，但是执行报错执行命令： bin/spark-submit \ --class org.apache.spark.examples.SparkPi \ --master yarn --deploy-mode cluster \ --executor-memory 1G \ --...

Scala调用Spark工具包出现错误: 找不到或无法加载主类

我在深圳的这些日子的博客

09-01

4899

使用IDEA编辑器搭建spark框架的时候，可能会遇上“找不到或无法加载主类”的问题。搜索出现此类情况的错误，不难发现网上很多信息指出这是因为混合了java 和scala，造成了不编译。但是，如果有使用他们的解决方法，还是失效的小伙伴们，那么可以试试我的办法。注：Scala版本为2.11.12；Java版本为1.8；Spark版本为2.1.0；系统是MAC OS。首先检查Scala的配置“File -> Project Structure…” 1）检查了"Platform Settings "项目

spark：一些bug的解决方案（IDEA & JAVA）

weixin_45730125的博客

07-06

685

spark（java）一些bug的解决方案

Spark代码提交到Yarn报错：java.lang.BootstrapMethodError: java.lang.NoClassDefFoundError: scala/runtime/java8

大数据跟我学i

03-19

1675

保存信息： ERROR Client: Application diagnostics message: User class threw exception: java.lang.BootstrapMethodError: java.lang.NoClassDefFoundError: scala/runtime/java8/JFunction2$mcIII$sp at com.czxy.WordCount_Spark$.main(WordCount_Spark.scala:29)

CentOS7安装Spark3.3.0 ON YARN集群并整合HIVE, Spark-On-HIVE

weixin_42154841的博客

08-21

2558

spark on Yarn，并且整合spark 与hive过程

Scala调用Spark工具包出现错误: 找不到或无法加载主类（eclipse篇）

qq_36249132的博客

08-08

876

idea问题请参考这篇文章 https://blog.csdn.net/llh_1178/article/details/88744738 使用eclipse编辑器搭建spark框架的时候，可能会遇上“找不到或无法加载主类”的问题。搜索出现此类情况的错误，不难发现网上很多信息指出这是因为混合了java 和scala，造成了不编译。如图：是因为Scala版本问题导致（我的是这个问题）再次运行，成功 ...

yarn 错误找不到或无法加载主类 install

qq_43203949的博客

07-18

2395

使用yarnpkg代替。

spark standalone启动报错 Error: Could not find or load main class org.apache.spark.deploy.worker.Worker

日常学习与专研的记录

03-26

611

解决报错：Error: Could not find or load main class org.apache.spark.deploy.worker.Worker node10: failed to launch: nice -n 0 /xxx/bin/spark-class org.apache.spark.deploy.worke

配置Scala环境出现：找不到或无法加载主类 scala.tools.nsc.MainGenericRunner

coderlaw's study

06-05

6308

出错情况：在cmd中运行scala提示错误：找不到或无法加载主类 scala.tools.nsc.MainGenericRunner 出错原因： scala是直接拷贝的其他电脑上的scala,放在Program File文件夹里。scala安装目录出现了空格。问题解决：讲Scala 移动到没有空格的文件夹下。重新设置SCALA_HOME。文件解决。

could not find or load main class

工作了一年的牛马，努力更新，方便自己能够快速找到已经出现过的错误并解决

12-26

3978

could not find or load main class 如果你也遇到了这个报错，切是在你本地开发程序的时候没有报错，打包给现场的时候报错了，不要怀疑，就是现场部署的有问题首先排查一下，结构目录是否正确，如果是用脚本启动，查看脚本对应的classpath路径是否和你部署的路径一致。第二，就是看你的jar包名称是否和脚本里面的程序名称或者启动命令的名称一致，基本上就这两个能排除大部分的错误了

idea连接sparkyarn

最新发布

04-03

### 配置 IntelliJ IDEA 连接 Spark on YARN 要在 IntelliJ IDEA 中配置并连接到 Spark on YARN 集群，可以按照以下方式操作： #### 1. 创建 Maven 或 SBT 项目在 IntelliJ IDEA 中创建一个新的 Maven 或 SBT 项目，并确保引入必要的依赖项。以下是 Maven `pom.xml` 文件的一个示例配置[^1]： ```xml <dependencies>  <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-core_2.12</artifactId> <version>3.3.0</version> </dependency>  <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-sql_2.12</artifactId> <version>3.3.0</version> </dependency>  <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-client</artifactId> <version>3.3.1</version> </dependency> </dependencies> ``` #### 2. 设置 SparkSession 和 Master URL 当编写 Spark 应用程序时，在初始化 `SparkSession` 或 `SparkContext` 时需指定 `--master yarn` 参数来表明应用程序将在 YARN 上运行。下面是一个简单的 Java 示例代码用于设置 SparkSession 并提交至 YARN[^5]: ```java import org.apache.spark.sql.SparkSession; public class WordCount { public static void main(String[] args) { String appName = "Word Count"; String masterUrl = "yarn"; // 使用 YARN 作为资源管理器 // 初始化 SparkSession SparkSession spark = SparkSession.builder() .appName(appName) .master(masterUrl) .config("spark.submit.deployMode", "client") // 客户端模式 .getOrCreate(); try { System.out.println("Application started..."); // 执行一些逻辑... spark.read().textFile(args[0]).show(); // 假设输入文件路径通过命令行参数传递 } finally { spark.stop(); } } } ``` 注意：为了防止 DNS 解析问题，建议显式地将本地 IP 地址绑定给 Spark Driver 节点。可以通过如下方式进行配置: ```java .config("spark.driver.host", "<your-local-ip>") .config("spark.driver.bindAddress", "<your-local-ip>") ``` #### 3. 构建可执行 JAR 文件构建包含所有依赖关系的 fat jar（uber-jar）。这通常通过 Maven 的 Shade 插件完成。编辑 `pom.xml` 添加插件定义[^2]: ```xml <build> <plugins> <plugin> <groupId>org.apache.maven.plugins</groupId> <artifactId>maven-shade-plugin</artifactId> <version>3.2.4</version> <executions> <execution> <phase>package</phase> <goals> <goal>shade</goal> </goals> </execution> </executions> </plugin> </plugins> </build> ``` 完成后运行以下命令生成 jar 文件: ```bash mvn clean package ``` #### 4. 提交作业到 YARN 使用 `spark-submit` 工具向 YARN 提交任务。假设已经生成了一个名为 `my-spark-app.jar` 的 jar 文件，则可以按以下格式调用[^4]: ```bash bin/spark-submit \ --class com.example.MainClass \ --master yarn \ --deploy-mode cluster/client \ /path/to/my-spark-app.jar input_path output_path ``` 其中： - `com.example.MainClass`: 主类名； - `/path/to/my-spark-app.jar`: 刚才打包好的 jar 文件位置； - `input_path`, `output_path`: 输入输出数据所在的 HDFS 路径； #### 5. 测试和调试测试过程中可能会遇到权限不足或其他错误情况，请确认集群上的环境变量以及安全策略是否允许外部访问[^3]。 ---