运行Spark常见问题处理方法（持续更新中......）

最新推荐文章于 2024-04-27 22:29:57 发布

Fortuna_i

最新推荐文章于 2024-04-27 22:29:57 发布

阅读量4.2k

点赞数 2

CC 4.0 BY-SA版权

分类专栏： Spark 文章标签： Spark 机器学习算法常见错误异常

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/fortuna_i/article/details/80648746

本文介绍了在运行Spark过程中遇到的MaxResultSize过大、Java heap space内存溢出以及Relative path错误等问题，提供了详细的解决方法，包括调整SparkConf参数、增大内存分配以及设置Spark缓存目录等。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.MaxResultSize问题

首先，出现这个错误的时候Spark会产生如下错误信息：

org.apache.spark.SparkException: Job aborted due to stage failure: Total size of serialized results of 77 tasks (1028.5 MB) is bigger than spark.driver.maxResultSize (1024.0 MB)

而后，继而会出现异常信息：java.lang.InterruptedException

这就是由于设置MaxResultSize这个参数过小而导致的，由上面信息可以看出Spark默认的MaxResultSize大小为1GB，所以解决这类错误的方法就是增大MaxResultSize。

解决方法：在设置SparkConf，即设置Spark参数时加入如下内容：

.set("spark.driver.maxResultSize", "4g")

2.Java heap space问题

内存溢出问题，异常信息为：Exception in thread "main" java.lang.OutOfMemoryError: Java heap space

之后会罗列出现此异常的代码位置信息，从根源开始，从上往下逐步罗列由此方法或者变量而导致后续出现的从小到大异常，简而言之，异常出现的根源是在此异常信息下的头一行语句中。

解决此类问题的方法有三：

（1）调整所用eclipse或者IDEA等软件设置的基础内存大小（eclipse在启动文件夹下存放的以.ini为后缀的文件即为配置文件；IDEA安装目录下bin目录下vmoptions文件，根据32位和64位选择配置）。

（2）调整jvm内存大小（eclipse内Window-Preferences-Java-Installed JREs选中所用jdk进行edit即

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。