hadoop的java.opts设置有误导致job setup失败

最新推荐文章于 2024-02-17 21:05:10 发布

原创最新推荐文章于 2024-02-17 21:05:10 发布 · 166 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#hadoop #java

hadoop 专栏收录该内容

20 篇文章

订阅专栏

本文记录了一次Hadoop集群中Job频繁Setup失败的问题排查过程。通过调整mapred.child.java.opts参数，逐步精简垃圾回收相关选项，最终解决了作业运行失败的问题。

由于各台机器配置不同，想单独设置每个节点的mapred.child.java.opts参数，开始设置为

<property>
<name>mapred.child.java.opts</name>
<value>-Xms512m -Xmx512m -XX:+UseConcMarkSweepGC -XX:+UseCMSCompactAtFullCollection -XX:+CMSClassUnloadingEnabled -XX:CMSInitiatingOccupancyFraction=80 -XX:PretenureSizeThreshold</value>
</property>

节点重启无误，但发现提交的job每次都setup fail，只有一一排查，最后精简为

<property>
<name>mapred.child.java.opts</name>
<value>-Xms512m -Xmx512m -XX:+UseConcMarkSweepGC</value>
</property>

job才正确运行，估计有些参数不支持所致。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

iteye_5062

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

hadoop 2.9.0 mapred-default.xml 属性集

06-02

31. mapred.child.java.opts 设置子进程的JVM参数，例如堆大小。 32. mapred.child.env 设置子进程的环境变量。 33. mapreduce.admin.user.env 定义管理员用户的环境。 34. yarn.app.mapreduce.am.log.level 定义...

参与评论您还未登录，请先登录后发表或查看评论

hadoop快速入门

03-20

hadoop快速入门，hadoop安装及hadoop配置

java opts环境你变_hadoop内存环境变量

weixin_39568232的博客

02-16

701

hadoop内存的配置，涉及到两个方面:namenode/datanode/resourcemanager/nodemanager的HEAPSIZE环境变量在配置文件/Configuration中影响MR运行的变量HEAPSIZE环境变量hadoop-env.sh此配置文件 hdfs和yarn脚本都会加载。hdfs是使用HADOOP_HEAPSIZE，而yarn使用新的环境变量YARN_HEAPS...

Hadoop搭建

qq_42578967的博客

05-06

199

Hadoop搭建 1.jdk安装在/opt下创建 softwares和servers 一个用来存放压缩包一个用来存放解压后的文件 yum -y install lrzsz 从windows上传文件到linux系统的工具把jdk的压缩包拖进softwares 解压到servers 改名 jdk-1.8 vim /etc/profile 添加 `export JAVA_HOME=/opt/servers/jdk-1.8` `export PATH=$PATH:$JAVA_HOME/bin` sou

Hadoop配置说明

余亚军的博客

07-24

715

Hadoop有两类配置文件，默认的default-site.xml和可以修改的site.xml，除此之外，还可以通过env.sh设置参数，同时env.sh也用于配置一些环境变量。

Hadoop基础之---配置

数据时代--收集，存储，处理，分析，挖掘，检索，展现

08-21

1602

Hadoop基础之---配置话说Hadoop的配置文件是相当多的，这里列出一些注意的，常用的。为什么要这么多配置，，配置就是为了方便配置，废话。因为很多时候代码里面写了很多Magic Number或者固定的路径或者固定的策略，而不同的环境，不同的需求可能会与默认的不同，所以需要修改，就放到配置文件里面，这样就可以随心所欲的设置了，而不用重新修改代码编译。 1.hadoop-env

HDFS核心参数配置

zhongmingyu

03-13

921

Hadoop里面NameNode和DataNode是动态分配的（hadoop3.x），并且都是984M。，如果服务器内存4G，NameNode内存可以配置3g。开启回收站功能，可以将删除的文件在不超时的情况下，恢复原数据，起到防止误删除、备份等作用。回收站目录在HDFS集群中的路径：/user/mingyu/.Trash/…企业经验：dfs.namenode.handler.count=修改core-site.xml，配置垃圾回收时间为60分钟。）注意：通过网页上直接删除的文件也不会走回收站。

【Hadoop】【Hadoop集群设置】【Hadoop Cluster Setup】

wq6qeg88的博客

02-17

843

NodeManager能够定期检查本地磁盘的健康状况（特别是检查nodemanager-local-dirs和nodemanager-log-dirs），并且在达到基于配置属性yarn.nodemanager.disk-health-checker. min-health-disks设置的坏目录数量阈值后，整个节点被标记为不健康，并且此信息也被发送到资源管理器。但是，NodeManager会继续运行该脚本，因此，如果节点再次变得健康，它将自动从ResourceManager上的黑名单节点中删除。

Flink Configuration简介

热门推荐

lmalds的专栏

12-19

1万+

Flink configuration

最新发布

10-22

conf.set("mapreduce.reduce.java.opts", "-Xmx1536m"); // 从命令行获取总节点数参数 conf.setLong("totalNodes", Long.parseLong(args[2])); Job job = Job.getInstance(conf, "PageRank"); job....

Hadoop学习-06-生产环境参数\调优

Ty的博客

05-17

976

HDFS核心参数建议配置 NameNode 内存 Hadoop2.x: NameNode 内存默认2000m，如果服务器内存4G，NameNode内存可以配置3g。在hadoop-env.sh 文件中配置如下。 HADOOP_NAMENODE_OPTS=-Xmx3072m Hadoop3.x hadoop-env.sh 中描述 Hadoop 的内存是动态分配的建议配置: NameNode最小值为1G,每增加1000000个Block增加1G内存 DataNode最小值为4G,每增加100

Hadoop 任务重要参数整理

半日闲的博客

06-14

2054

后台服务进程信息查看 conf jmx logs logLevel stacks 调试信息 set hive.execution.engine=mr; set yarn.nodemanager.delete.debug-delay-sec=1200; 日志保留时间，单位：秒 set mapreduce.task.timeout=60000000; 在debug的时候，c...

五、Hadoop高可用部署

ynzzxc的博客

03-29

1598

（1）下载安装包并解压到指定目录（2）修改配置文件，并添加必要变量（3）分发到其他节点，配置环境变量以dataxc用户为例，脚本示例如下： #!/bin/bash # hadoop.sh nodes=(n101 n102 n103) #集群地址 zk_connect='n101:2181,n102:2181,n103:2181' hdns='n101:8485;n102:8485;n103:8485' #解压hadoop到程序目录 cd /home/dataxc/sw &&amp

Hadoop 参数 mapred.map.child.java.opts

zhuhailong

10-17

1万+

Hadoop mapred.map.child.java.opts 解决 outofmemory问题

如何合理设置hadoop相关组件的jvm Xmx

leo的大数据之路

04-23

5552

1.这个问题不是很简单么？直接设置不久好了，java -Xmx2000m像这样不就好了。No,我说的不仅仅是这个问题，比如，你看到/usr/local/bigdata/jdk/bin/java -Xmx2048m -Djava.net.preferIPv4Stack=true -Dhadoop.log.dir=/usr/local/bigdata/hadoop/logs -Dhadoop.log.

JVM内存JAVA_OPTS参数说明

rick_123的专栏

12-01

2108

JAVA_OPTS="-server -Xms2048m -Xmx2048m -Xss512k" -server:一定要作为第一个参数，在多个CPU时性能佳 -Xms：初始Heap大小，使用的最小内存,cpu性能高时此值应设的大一些 -Xmx：java heap最大值，使用的最大内存上面两个值是分配JVM的最小和最大内存，取决于硬件物理内存的大小，建议均设为物理内存的一半。 -XX:P

Hadoop内存溢出(OOM)分类、参数调优化（代码模拟内存溢出类型并分析原因）

aijiudu的博客

07-15

1万+

MapReduce作业运行过程中内存溢出错误分类 1、 Mapper/Reducer阶段JVM内存溢出（一般都是堆） 1) JVM堆(Heap)内存溢出：堆内存不足时，一般会抛出如下异常：第一种：“java.lang.OutOfMemoryError:” GC overhead limit exceeded；第二种：“Error: Java heapspace

beeline 连接，参数报错 Cannot modify ** at runtime. It is in the list of parameters that can‘t be modified

QiwzDeBLOG的博客

05-12

2930

CDH 大数据集群，使用beeline 连接hiveserver2时，后面跟spark的一些参数时。报错Failed to open new session: java.lang.IllegalArgumentException: Cannot modify hive.spark.client.server.connect.timeout at runtime. It is in the list of parameters that can't be modified at runtime or is p

Hadoop使用常见问题以及解决方法4

weixin_30553065的博客

04-12

130

Hadoop添加节点的方法自己实际添加节点过程：1. 先在slave上配置好环境，包括ssh，jdk，相关config，lib，bin等的拷贝；2. 将新的datanode的host加到集群namenode及其他datanode中去；3. 将新的datanode的ip加到master的conf/slaves中；4. 重启cluster,在cluster中看到新的datanode节点；5....

07-03

`java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows.access0` 通常出现在 Windows 系统上运行 Hadoop 相关程序时，由于缺少必要的本地库文件（如 `winutils.exe` 和 `hadoop.dll`）...