为什么 Java 进程使用的 RAM 比 Heap Size 大?​ | 优快云博文精选

本文深入探讨了Java进程的内存消耗,不仅介绍了Java堆、代码缓存等JVM内部组件的内存使用情况,还讨论了线程栈、堆外内存及本地库等外部因素对Java进程虚拟内存的影响。

 

640?wx_fmt=gif

640?wx_fmt=jpeg

作者 | javaadu

责编 | 郭芮

出品 | 优快云 博客

Java进程使用的虚拟内存确实比Java Heap要大很多。JVM包括很多子系统:垃圾收集器、类加载系统、JIT编译器等等,这些子系统各自都需要一定数量的RAM才能正常工作。

当一个Java进程运行时,也不仅仅是JVM在消耗RAM,很多本地库(Java类库中引用的本地库)可能需要分配原生内存,这些内存无法被JVM的Native Memory Tracking机制监控到。Java应用自身也可能通过DirectByteBuffers等类来使用堆外内存。

那么,当一个Java进程运行时,有哪些部分在消耗内存呢?这里我们只展示哪些可以被Native Memory Tracking监控到的部分。

 

640?wx_fmt=png

JVM部分

 

Java Heap:最明显的部分,Java对象在这个区域分配和回收,Heap的最大值由-Xmx决定。

Garbage Collector:GC的数据结构和算法需要额外的内存对堆内存进行管理。这些数据结构包括:Mark Bitmap、Mark Stack(用于跟踪存活的对象)、Remembered Sets(用于记录region之间的引用)等等。这些数据结构中的一些是可以直接调整的,例如:-XX:MarkStackSizeMax,其他的则依赖于堆的分布,例如:分区大小,-XX:G1HeapRegionSize,这个值越大Remembered Sets的值越小。不同的GC算法需要的额外内存是不同的,-XX: UseSerialGC和-XX: UseShenandoahGC需要较小的额外内存,G1和CMS则需要Heap size的10%作为额外内存。

Code Cache:用于存放动态生成的代码:JIT编译的方法、拦截器和运行时存根。这个区域的大小由-XX:ReservedCodeCacheSize确定(默认是240M)。使用-XX-TieredCompilation关掉多层编译,可以减少需要编译的代码,从而减少Code Cache的使用。

Compiler:JIT编译器需要一些内存来才能工作。这个值可以通过关闭多层编译或减少执行编译的线程数(-XX:CICompilerCount)来调整.

Class loading:类的元数据(方法的字节码、符号表、常量池、注解等)被存放在off-heap区域,也叫Metaspace。当前JVM进程加载了越多的类,就会使用越多的metaspace。通过设置-XX:MaxMetaspaceSize(默认是无限)或-XX:CompressedClassSpaceSize(默认是1G)可以限制元空间的大小。

Symbol tables:JVM中维护了两个重要的哈希表:Symbol表包括类、方法、接口等语言元素的名称、签名、ID等,String table记录了被interned过的字符串的引用。如果Native Tracking表明String table使用了很大的内存,那么说明该Java应用存在对String.intern方法的滥用。

Threads:线程栈也会使用RAM,栈的大小由-Xss确定。默认是1个线程最大有1M的线程栈,幸运得失事情并没有这么糟糕——OS使用惰性策略分配内存页,实际上每个Java线程使用的RAM很小(一般80~200K),作者使用这个脚本(https://github.com/apangin/jstackmem)来统计有多少RSS空间是属于Java线程的。

 

640?wx_fmt=png

堆外内存(Direct buffers)

 

Java应用可以通过ByteBuffer.allocateDirect显式申请堆外内存;默认的堆外内存大小是-Xmx,但是这个值可被-XX:MaxDirectMemorySize覆盖。在JDK11之前,Direct ByteBuffers被NMT(Native Memory Tracking)列举在other部分,可以通过JMC观察到堆外内存的使用情况。

除了DirectByteBuffers,MappedByteBuffers也会使用本地内存,MappedByteBuffers的作用是将文件内容映射到进程的虚拟内存中,NMT没有跟踪它们,想要限制这部分的大小并不容易,可以通过pmap -x 命令观察当前进程使用的实际大小:

1Address           Kbytes    RSS    Dirty Mode  Mapping
2...
300007f2b3e557000   39592   32956       0 r--s- some-file-17405-Index.db
400007f2b40c01000   39600   33092       0 r--s- some-file-17404-Index.db

 

640?wx_fmt=png

 

本地库(Native libraries)

 

由System.loadLibrary加载的JNI代码也会按需分配RAM,并且这部分内存不受JVM管理。在这里需要关注的是Java类库,未关闭的Java资源会导致本地内存泄漏,典型的例子是:ZipInputStream或DirectoryStream。

JVMTI agent,特别是jdwp调试agent,也可能导致内存的过量使用(PS:去年写memory agent代码造成的内存泄漏记忆犹新)。

 

640?wx_fmt=png

Allocator issues

 

一个Java进程可以通过系统调用(mmap)或标准库(malloc)方法来向OS申请内存。malloc自己又通过mmap来向OS申请比较大的内存,并通过自己的算法来管理这些内存,这可能会导致内存碎片,从而导致过量使用虚拟内存。jemalloc是另外一个内存分配器,它比常规的malloc分配器需要更少的footprint,因此可以在自己的C 代码中尝试使用jemalloc方法。

 

640?wx_fmt=png

结论

 

无法准确统计一个Java进程使用的虚拟内存,因为有太多因素需要考虑,列举如下:

 

1Total memory = Heap   Code Cache   Metaspace   Symbol tables  
2               Other JVM structures   Thread stacks  
3               Direct buffers   Mapped files  
4               Native Libraries   Malloc overhead   ...

 

作者:优快云博主「javaadu」,本文首发于作者优快云博客https://blog.youkuaiyun.com/duqi_2009/article/details/101158407。

扫描下方二维码,下载 优快云 App,查看博主精彩分享

640?wx_fmt=png

 

【END】

学Python想要达到大牛水准,你得这么学!

https://edu.youkuaiyun.com/topic/python115?utm_source=csdn_bw

优快云 博客诚邀入驻啦!

本着共享、协作、开源、技术之路我们共同进步的准则,

只要你技术够干货,内容够扎实,分享够积极,

欢迎加入 优快云 大家庭!

扫描下方二维码,即刻加入吧!

640?wx_fmt=jpeg

 热 文 推 荐 

 
Python 分析热门旅游景点,告诉你哪些地方好玩、便宜、人又少!
 
 
 
 
 
 
640?wx_fmt=gif 点击阅读原文,即刻阅读《程序员大本营》最新期刊。
640?wx_fmt=png
你点的每个“在看”,我都认真当成了喜欢
### Java Heap 概念及作用 Java Heap 是 JVM (Java 虚拟机) 中一块专门用于动态分配内存的空间[^1]。当程序运行时,所有的对象实例和数组都会被创建在这个区域里。 #### 特点 - **生命周期**:Heap 的存在周期与整个应用程序相同,在应用启动时初始化并一直持续到应用结束。 - **垃圾回收机制**:JVM 自动管理这块空间内的内存分配与释放工作,通过内置的垃圾收集器来清理不再使用的对象所占用的空间,从而防止内存泄漏等问题的发生[^3]。 #### 结构组成 通常情况下,Heap 可以分为新生代(Young Generation) 和老年代(Tenured/Old Generation),其中新生代又细分为 Eden Space 和两个 Survivor Spaces(S0/S1): - **Eden区**: 新建的对象一般会优先放置在此处; - **Survivor区**(S0/S1): 经过一次Minor GC 后仍然存活下来的年轻对象会被移动到这里继续观察一段时间;如果经历多次GC后依然存活,则晋升至老年区; - **Old区/tenure区**: 存储较长时间内未被销毁的对象或者是经过多轮筛选后的持久化数据结构。 #### 设置方法 可以通过命令行参数 `-Xms` 来指定初始堆小,而使用 `-Xmx` 则可以设置最可用堆容量。合理配置这些选项有助于提高性能表现,尤其是在处理规模数据集的应用场景下显得尤为重要。 ```bash java -Xms512m -Xmx4g MyApplication ``` 上述代码表示给定应用程序 `MyApplication` 分配最小 512MB ,最可达 4GB 的堆内存资源。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值