Mapreduce 参数---mapred.map.child.java.opts

Hadoop Job 集群Load过高问题解析

最新推荐文章于 2025-09-13 15:52:38 发布

转载最新推荐文章于 2025-09-13 15:52:38 发布 · 3.5k 阅读

文章标签：

#hadoop #mapreduce

大数据专栏专栏收录该内容

92 篇文章

订阅专栏

本文分析了HadoopJob集群Load过高的原因，发现是由于mapred.child.java.opts设置不当导致内存资源耗尽。文章介绍了如何合理设置此参数及mapreduce.map.memory.mb等相关参数。

最近发现Hadoop Job集群的load非常高，最后发现是mapred.child.java.opts设置过大导致的，我们当初设置为-Xmx5120导致TaskTracker上内存资源耗尽，进而开始不断swap磁盘上数据，load升高在执行一个Task的时候，首先会根据JobConf中设定的JVM参数写入一个taskjvm.sh文件中，然后调用Linux命令 bin/bash -c taskjvm.sh 来执行 task.

mapred.child.java.opts就是设定jvm的参数之一，在新版本中已经标准为过期，取而代之的是区分Map Task 和Reduce Task 的jvm opts , mapred.map.child.java.opts和mapred.reduce.child.java.opts(默认值为-Xmx200m)

当用户在不设置该值情况下，会以最大1G jvm heap size启动task，有可能导致OutOfMemory，所以最简单的做法就是设大参数，并且由于这个值不是final，所以用户可以在自己的mapred-site.xml中可以覆盖默认值mapreduce.admin.map.child.java.opts mapreduce.admin.reduce.child.java.opts