记一次 HDFS NameNode GC 调优

最新推荐文章于 2020-09-21 14:25:05 发布

原创

最新推荐文章于 2020-09-21 14:25:05 发布 · 3.4k 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文分享了两个HDFS NameNode GC调优的实战案例。通过对NameNode工作原理的理解，调整新生代和老年代大小，解决了频繁GC导致的性能问题。优化后，GC时间显著降低，RPC响应更稳定，提升了整体服务性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

没有碰到过 GC 问题的人生对写 Java 的人来说是不完整的。大数据生态圈的框架大都以 JVM 系语言开发（Java Scala 为主），毕竟生态成熟嘛要啥有啥。

HDFS 作为大数据领域的默认分布式文件系统，其运作方式导致了非常容易碰到 GC 问题：

大量的元数据需要保存在内存中，使得很容易就需要几十 G 甚至 100 多 G 的堆
大量且高并发的文件读写操作使得频繁地产生新对象

下面就举两个例子，简单分享下我们做的一些调优。

案例一

有业务同事反馈任务跑的慢，虽然后来确认是其他原因导致的，但在分析过程中，我们从监控观察到 RPC 排队时间和处理时间不是很稳定，有时会出现几秒甚至10多秒的的毛刺，进而注意到 GC。

640?wx_fmt=png

一分钟一个点，大概每分钟有 2、3秒花在 GC 上。我们用的是经典的 ParNew + CMS 的组合，查看 GC 日志发现大部分都是新生代的 GC，也就意味着有 3% - 5%的时间是 STW 的。这个比例看着不大，但在 NameNode 每秒几 K 甚至几十 K 的事务的压力下，绝对数值和对具体业务的影响还是不能忽视的。

知道了原因，调整就很简单了。从 NameNode 的工作原理分析，大量文件的读写确实会创建很多临时对象，调大新生代就是很自然也很正确的办法。一方面，更大的新生代能减少 minor gc 的次数；另一方面，更多临时对象在

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄16年

50
原创

19
点赞

81
收藏

33
粉丝

关注

私信

热门文章

分类专栏

上一篇：: 从校训、企业文化到团队文化

下一篇：: 谈谈不可替代性

最新评论

记一次 HDFS NameNode GC 调优
weixin_39518252: NameNode 需要消耗非常大的堆，CMS超过16G，G1垃圾回收器在超过64G的堆之后作用就不大了，如果内存足够大，可以考虑使用Azul的C4垃圾回收看，堆大小可以支持到8T，就可以解决long gc暂停问题。
记一次 HDFS NameNode GC 调优
呼卓宇: 问题定位了，我们引用了jmx，而jmx引入Java RMI机制导致Full GC，当应用程序通过RMI发布消息或消费服务时，JVM会定期启动Full GC，确保本地未使用的对象也不会占用内存空间，即使没有在代码逻辑当中添加任何基于RMI的内容，第三方库或工具类仍然可以打开RMI端点（常见的就是JMX），如果远程连接到它，它就会使用RMI在底层发布数据。 RMI造成的问题通常是老年代剩有大量空间，但是会触发Full GC，造成stop-the-world。
记一次 HDFS NameNode GC 调优
呼卓宇: 大佬您好，通过System.gc()去触发gc这条，我理解JVM的垃圾回收是自动进行的，无须手动触发。但是在查看-gccause的时候，发现还真是System.gc()引起的，我有点不确定是不是这个原因，您当初是如何排除掉这点的呢？
漫谈分布式系统(1) -- 为什么要有分布式系统
Nick Wilde007: 好家伙，直接解答了我的疑问，感谢。
漫谈核心能力(5) -- 重点抓好，才能高效
程序猿学长: 感谢分享,学习了

大家在看

最新文章

目录

展开全部

收起

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。