hue oozie OutOfMemoryError: Java heap space

当使用hue提交spark作业时,出现OutOfMemoryError: Java heap space异常。问题在于hue借助oozie提交作业,而oozie的默认配置可能覆盖了自定义的参数。解决方案是通过配置以`oozie.launcher.mapred.child.java.opts`为前缀的属性,将参数传递给YARN,以此解决oozie调度spark作业时的内存溢出问题。参考相关文章可了解详细步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

报出的错误:OutOfMemoryError: Java heap space

问题出现的场景:使用hue提交spark作业

本来一个在终端使用spark-submit提交可以运行成功的程序,等配置到hue上竟然堆异常了。关键在hue上也配置了--num-executors等参数,而且和spark submit提交方式的参数一样的。优化了半天发现依然不能通过。

所以我们猜想是hue在提交spark作业时加载了默认配置,这些默认设置可能覆盖或限制了我们自己的配置。但是去哪里修改这些默认配置呢

hue在提交spark时借助的还是oozie,所以是oozie加载了自己的配置。

 

Oozie通过 launcher job 运行某个具体的Action。launcher job是一个 map-only的MR作业,而且并不知道它将在集群的哪台机器上执行这个MR作业。

在上图中,Oozie Client提交了一个workflow给Oozie Server。这个workflow里面要执行具体的Hive作业(Hive Action)

首先Oozie Server会启动一个MR作业,也就是launcher job,由launcher job来发起具体的Hive作业。(Hive作业本质上是MR作业)

解决方案

通过配置以oozie.launcher为前缀的属性(对应Hadoop的参数配置),Oozie在提交Launcher作业时,会将这些参数传递给YARN。

参考3中使用此种方法

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

快乐的打字员

谢谢打赏~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值