JobTracker Memory Leak

针对Hadoop集群中作业跟踪器(JT)出现的内存溢出问题,通过调整JVM参数并实施特定策略来避免内存泄漏,确保ETL过程稳定运行。

前阶段发生过两次JTCDH4.2.0 OOM的问题,导致ETL过程出错;由于是刚接手的集群参数大多是默认的,修改了JTJVM参数相关的CMS,同时减小了retireJobintervalcachesize看看是否奏效.发现过了三天又开始报警了,查看监控看到Old gen一直在涨根本释放不掉,估计是memory leak,做个内存dump分析吧(10GBheap size),做了两次dump发现FileSystem$Cache部分一直在涨:

103638996.png

Google了一下果然找到了相关的Bughttps://issues.apache.org/jira/browse/MAPREDUCE-5351;解决方案主要:

1.监控JT,符合一定阈值重启

2.修改如下参数,并写脚本手动清理job file

<property>

<name>keep.failed.task.files</name>

<value>true</value>

</property>


<property>

<name>keep.task.files.pattern</name>

<value>buhuibeipipeidaodezhengzebiaodashi</value>

</property>

不过方法2kerboros环境下有个bug: https://issues.apache.org/jira/browse/MAPREDUCE-5047,最终采取了方案1


本文转自MIKE老毕 51CTO博客,原文链接:http://blog.51cto.com/boylook/1298929,如需转载请自行联系原作者


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值