JVM浅谈

本文详细介绍了Java内存模型的各个组成部分,包括堆、栈、本地方法栈、方法区及程序计数器,并深入探讨了Java垃圾回收机制,涵盖了标记清除、复制、标记整理和分代收集等算法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.Java内存模型
1.1内存模型图解
Java虚拟机在执行Java程序的过程中,会把它所管理的内存划分若干个不同的数据区。这些区域有各自的用途,以及创建和销毁的时间,有的区域随着虚拟机的进程的启动而存在,有得区域则依赖用户线程的启动和结束而建立和销毁,我们可以将这些区域统称为Java运行时数据区域。
如上图所示Java虚拟机运行时数据区域被分成5个区域,堆,栈,本地方法栈,方法区以及程序计数器。
1.2堆(Heap)
对于大多数应用来说,Java Heap时Java虚拟机管理的内存的最大一块,这快区域随着虚拟机的启动而创建。在实际的运用中,我们创建的对象和数组就是存放在堆里面。如果听说线程安全的问题,就会很明确的知道Java Heap 是一块共享的区域,操作共享区域的成员就有了锁和同步。
与Java Heap相关的还有Java额垃圾回收机制(GC),Java Heap 时垃圾回收器管理的主要区域。程序所熟悉的新生代,老生代,永久代(java1.7好像有变化)的概念就是放在堆里面,现在大多数的GC基本都采用了分代收集算法,如果再细致一点,JavaHeap还有Eden空间,FromSurvivor空间,ToSurvivor空间。Java Heap可以处于物理上不连续的内存空间中,只要逻辑上时连续的就行。下面时Java Heap的内存详解。
1.3栈(Stack)
相对于Java Heap来讲,Java Stack是线程私有的,她的生命周期与线程相同。Java Stack描述的是Java方法执行时的内存模型,每个方法执行时都会创建一个栈帧(Stack frame) 用于储存局部变量表,操作数栈,动态链接,方法出口等信息。从下图我们可以看到,每一个线程执行一个方法时都意味着有一个栈帧在当前线程对于的栈帧中的入栈和出栈。
还可以从上图观察到每一个栈帧都有局部变量表,局部变量存放了编译期间各种基本数据类型,对象引用信息。
1.4本地方法栈(Native Stack)
本地方法栈与Java虚拟机栈所发挥的作用相似,他们之间的区别在于虚拟机栈为虚拟机执行Java方法(字节码)服务,而本地方法栈则为使用到Native方法服务。
1.5方法区(Method Area)
方法区与堆一样,是各个线程共享的内存区域,它用于存储虚拟机加载类信息,常量,静态变量,即时编译器编译后的代码等数据。虽然Java虚拟机规范吧方法区描述为堆的一个逻辑部分,但是它却有宇哥别名叫做非堆。分析Java虚拟机虚拟机规范,值所以吧方法区描述一个逻辑的部分,应该觉得它们都是储存数据的角度出发的。一个储存对象对象数据(堆),一个存储静态信息方法区。

1.6总结:
在上文中我们看到堆中有新生代。老生代。永久代的描述,我们为什么把三者一起说呢?那是因为HotSpot虚拟机的设计把GC分代收集扩展至方法区或者说使用永久代来实现方法区而已,这样HotSpot的垃圾收集器就能想管理Java堆一样管理这部分内存。简单点说就是HotSpot虚拟机中的内存模式的分代,其中新生代,老生代在堆中。永久代使用方法区的实现。根据官方发布的线路图信息,现在也有放弃永久代逐步采用Native Memory来实现方法区的规划,在JDK1.7的HotSpot中,已经把原来放在永久代的字符串常量池移出。
线程私有的数据区域有:Java虚拟机栈和本地方法栈
线程共有的数据区域有:堆以及方法区
2.GC算法
2.1标记清除算法
标记出所需要回收的对象,在标记完成后统一回收所有被标记的对象
缺点:
一个是效率问题,标记和清除连个过程的效率都不高。
标记清除之后产生大量不连续的内存碎片,空间碎片太多会导致以后在程序运行过程中,需要分配较大对象时,无法找到足够的连续内存而不得不提前出发另一次垃圾收集动作。
2.2复制算法
将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。
当这一块内存用完了,就将还存活的的对象复制到另一块上面,然后把已经使用过的内存空间清理一次。
优点:这样使得酶促都是对整个的半个区域进行内存回收,内存分配时也就不用考虑内存碎片的问题,只要移动指针,按顺序分配内存即可,实现简单,运行高效,只是这种算法的代价时将真正使用内存空间缩小为原来的一半。
缺点:复制收集算法在对象存活率较高时就要进行较多的复制操作,效率将会变低。
2.3标记-整理算法
1.标记
2.让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存空间。
2.4分代收集算法
根据对象存活周期不同将内存划分为几块。
一般是把Java堆分成新生代和老年代,这样就可以根据各个年代的特点,采用适当的收集算法
在新生代中,每次垃圾收集时都发现有大批的对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。
老年代中因为对象的存活率高,没有额外的对它进行分配担保,就可以选择标记整理或者标记整理算法来进行回收。
3收集器
3.1Serial收集器
一个单线程的收集器,“Stop the world”对于运行在Client模式下的虚拟机来说是一个很好的选择,简单高效。
3.2Serial Old收集器
Serial收集器老年代的版本,同样是一个单线程的收集器,使用标记整理的算法。主要意义也是在于给Client模式下的虚拟机使用,在server模式下,主要有两大用途,一种时在java1.5之前和Parallel Scavenge收集器搭配使用,另一种就是作为CMS的收集器的后备预案,在并发收集发生Concurrent Mode Failure时使用。
3.3ParNew收集器
Serial收集器的多线程版本。但CPU不如Serial,Server模式下新生代首选,目前只有它能与CMS收集器配合工作。
3.4Parallel Scavenge收集器
吞吐量优先的收集器,新生代收集器,复制算法,并行的多线程收集器,目标是达到一个可以控制的吞吐量(运行用户代码时间/(运行用户代码时间+垃圾回收时间))
并行:指的是多条垃圾收集线程并行工作,但此时用户线程一直处于等待状态。
并发:指的是线程与垃圾收集线程同时执行(但不一定是并行的,可能会交替执行),用户程序在继续运行,而垃圾收集程序运行于另一个CPU上。
3.5CMS收集器
一款优秀的收集器,以获取最短回收停顿时间为目标的收集器。非常符合互联网或者B/S系统的服务器端上,重视服务的响应速度,希望系统停顿时间最短的应用,基于标记-清除算法实现的,CMS收集器的内存过程是和用户线程一起并发执行的。优点是,并发收集,低停顿。缺点是对CPU资源非常敏感,无法处理浮动垃圾,可能出现“Concurrent Mode Full”失败而导致另一次Full GC的产生。
3.6G1收集器
当今收集器技术发展的最前沿的成果之一,G1是一款面向服务器端应用的垃圾回收器,优点:并行与并发(充分利用CPU,多核环境的硬件优势) 分代收集(不需要其他收集器配合能独立管理整个GC堆)空间整合(标记-整理算法实现的收集器,局部上,基于复制算法,不会尝试内存空间碎片) 可预测的停顿(能让使用者明确指定在一个长度为m毫秒的时间片段内,消耗垃圾收集上的时间 不得超过n毫秒) 步骤: 初始标记 并发标记 最终标记 筛选回收。

4.JVM参数列表
-Xmx3550m:最大堆内存为3550M。
-Xms3550m:初始堆内存为3550m。
此值可以设置与-Xmx相同,以避免每次垃圾回收完成后JVM重新分配内存。
-Xmn2g:设置年轻代大小为2G。
整个堆大小=年轻代大小 + 年老代大小 + 持久代大小。持久代一般固定大小为64m,所以增大年轻代后,将会减小年老代大小。此值对系统性能影响较大,Sun官方推荐配置为整个堆的3/8。
-Xss128k:设置每个线程的堆栈大小。
JDK5.0以后每个线程堆栈大小为1M,在相同物理内存下,减小这个值能生成更多的线程。但是操作系统对一个进程内的线程数还是有限制的,不能无限生成,经验值在 3000~5000左右。 
-XX:NewRatio=4:设置年轻代(包括Eden和两个Survivor区)与年老代的比值(除去持久代)。设置为4,则年轻代与年老代所占比值为1:4,年轻代占整个堆栈的1/5
-XX:SurvivorRatio=4:设置年轻代中Eden区与Survivor区的大小比值。
设置为4,则两个Survivor区与一个Eden区的比值为2:4,一个Survivor区占整个年轻代的1/6
-XX:MaxPermSize=16m:设置持久代大小为16m。
-XX:MaxTenuringThreshold=15:设置垃圾最大年龄。
如果设置为0的话,则年轻代对象不经过Survivor区,直 接进入年老代。对于年老代比较多的应用,可以提高效率。如果将此值设置为一个较大值,则年轻代对象会在Survivor区进行多次复制,这样可以增加对象 再年轻代的存活时间,增加在年轻代即被回收的概论。

收集器设置
-XX:+UseSerialGC:设置串行收集器
-XX:+UseParallelGC:设置并行收集器
-XX:+UseParalledlOldGC:设置并行年老代收集器
-XX:+UseConcMarkSweepGC:设置并发收集器
垃圾回收统计信息
-XX:+PrintGC
-XX:+PrintGCDetails
-XX:+PrintGCTimeStamps
-Xloggc:filename
并行收集器设置
-XX:ParallelGCThreads=n:设置并行收集器收集时使用的CPU数。并行收集线程数。
-XX:MaxGCPauseMillis=n:设置并行收集最大暂停时间
-XX:GCTimeRatio=n:设置垃圾回收时间占程序运行时间的百分比。公式为1/(1+n)
并发收集器设置
-XX:+CMSIncrementalMode:设置为增量模式。适用于单CPU情况。
-XX:ParallelGCThreads=n:设置并发收集器年轻代收集方式为并行收集时,使用的CPU数。并行收集线程数。
5.一般面试的问题:
5.1类加载器的组成
根加载器:用于加载java核心jar
扩展类加载器:用于加载java扩展类库
应用类加载器:用于加载class Path下的jar包
以上类加载器继承顺序由上而下
5.2JVM内存管理机制,有那些区域,每个区域都做了什么?
堆,线程共享,主要存放我们新建的对象和数组都在这里分配内存。
方法区,线程共享,存储虚拟机加载的类信息,常量,静态变量。
栈:线程私有,与线程生命周期相同,用于存储局部变量表,操作栈,方法返回值,局部变量表放着基本数据类型,还有对象的引用信息。
本地方法栈:线程私有。跟虚拟机栈相似,不过它是为虚拟机使用到的Native方法服务。
程序计数器:线程私有,是一种数据结构,用于保存当前正常执行的程序的内存地址(字节码之类)。Java虚拟机的多线程就是通过线程轮流切换并分配处理时间来实现的,为了线程切换后能回复到正确的位置,每条线程都需要一个独立的程序计数器,互不影响,该区域线程私有。
运行时常量池:保存各种字面量(基本数据类型)和符号引用(以及符号表示的引用地址)
5.3类加载机制的步骤,每一步做了什么,static和final修饰的成员变量的加载时机
装载:导入加载class文件
链接:校验class文件正确性,为静态变量分配空间,将符号引用转为直接引用
初始化:初始化静态变量/静态代码块。
5.4 垃圾回收算法
标记清除
复制算法
标记整理
分代收集
5.5 垃圾回收器
串行 Serial收集器 Serial Old收集器
并行 ParNew收集器 Parallel Scavenge收集器
并发 CMS收集器 G1收集器
5.6垃圾回收策略
引用计数算法:给对象添加一个引用计数器,每当有引用它时+1当引用失效时减1任何时刻计数器为0的对象就是不可能再被引用。(无法循环使用对象)
可达性分析算法:也称为根搜索算法,从节点GCRoots的对象作为起始点,从这些节点向下搜索,搜索所走过的路径称为引用链,当一个对象到GC Roots没有任何引用链相连,即从GCRoots到这个对象不可达,则证明此对象是不可用的。
5.7jvm参数的设置
-server :设置运行环境为客户端和服务器端
-Xms值:设置JVM最大的可用内存
-Xmx值:设置JVM初始化的内存大小(建议设置成一样,避免垃圾回收完成后JVM重新分配内存)
-Xmn值:设置年轻代的大小(整个JVM内存的大小=年轻代+老年代+永久区)持久代一般大小已经确定,官方推荐为3/8.
-Xss值:设置每个线程的堆栈大小。
其他的如上
5.8jvm调优
1堆大小设置合理(建议看官方相关文档)
2回收器选择(吞吐量优先选择并行收集器,响应时间优先选择并发收集器,客户端选择串行收集器)
3辅助信息
4减少堆引起的碎片问题。
5.9双亲委派模型
全盘负责指使用一个类加载器加载类时,除非显示地调用另一个类加载器,否则该类多依赖的其他类均由该类加载器加载双亲委派指加载类时遵循classloader继承关系,从跟加载器开始加载,避免恶意的基础类混淆攻击
<think>嗯,用户想了解JVM的工作原理和基本概念。首先,我需要回顾一下JVM的基本结构和运行机制。根据用户提供的引用,JVM主要包括类加载子系统、运行时数据区、执行引擎和本地方法接口等部分。运行时数据区又分为方法区、堆、虚拟机栈、本地方法栈和程序计数器。用户之前提到的引用中提到了堆、栈、方法区等,所以需要详细说明这些部分。 首先,类加载过程可能需要分步骤解释,加载、链接、初始化这三个阶段。然后运行时数据区中的各个部分,比如堆是对象实例存储的地方,是GC的主要区域,分代结构(年轻代、老年代、永久代/元空间)。虚拟机栈和本地方法栈的区别,栈帧的结构,局部变量表、操作数栈这些内容。程序计数器的作用,线程私有,记录当前执行地址。 执行引擎部分需要解释解释器和JIT编译器,以及它们的协作。本地方法接口调用本地库。垃圾回收机制的基本原理,分代收集算法,不同区域的GC策略,比如年轻代的Minor GC,老年代的Major GC,还有Full GC。 可能还需要提到JVM的内存管理,比如如何分配内存,对象的创建和回收过程。此外,用户提供的引用中有提到永久存储区(方法区),在JDK8之后被元空间替代,使用本地内存,避免OOM。 用户的问题需要结构清晰的回答,所以应该分点讲解,每个部分简明扼要。同时,生成的相关问题要围绕JVM的结构、内存管理、类加载、垃圾回收等方面,确保覆盖用户可能感兴趣的后续问题。 在回答时要注意使用正确的中文术语,比如“栈帧”而不是“栈框架”,确保LaTeX格式正确,行内公式用$...$,独立公式用$$...$$。比如在讲解对象内存分配时,可能需要公式表示内存地址,但用户提供的引用中没有具体公式,所以可能不需要太多数学表达式,但如果有涉及的话要正确应用。 最后,检查引用是否正确标注,例如方法区的信息引用[4],堆的结构引用[3],栈的局部变量引用[2]等。确保每个引用标记自然,不干扰阅读。同时,生成的问题要有助于用户深入理解,比如JVM内存结构、类加载机制、垃圾回收优化、元空间永久代的区别等。</think>### JVM工作原理基本概念详解 --- #### **一、JVM核心组成** Java虚拟机(JVM)是Java程序运行的核心环境,主要包含以下模块: 1. **类加载子系统** 负责加载`.class`文件,解析为JVM可识别的数据结构,过程分为三个阶段: - **加载**:查找并加载类的二进制数据。 - **链接**:验证、准备(分配静态变量内存)、解析(符号引用转直接引用)。 - **初始化**:执行类构造器`<clinit>()`方法[^4]。 2. **运行时数据区** JVM内存分为以下区域: - **方法区(Method Area)** 存储类元数据(如类名、方法代码)、静态变量、常量池等。JDK8后由“永久代”改为“**元空间(Metaspace)**”,直接使用本地内存[^4]。 - **堆(Heap)** 所有线程共享,存储对象实例和数组,是垃圾回收的主战场。采用分代结构: - 年轻代(Young Generation):存放新对象,分为Eden、Survivor区。 - 老年代(Old Generation):长期存活的对象。 $$ \text{堆内存} = \text{年轻代} + \text{老年代} $$ [^3] - **虚拟机栈(JVM Stack)** 线程私有,存储栈帧(Frame),每个栈帧对应一个方法调用,包含局部变量表、操作数栈等[^2]。 - **本地方法栈(Native Method Stack)** 为本地方法(如C/C++代码)服务。 - **程序计数器(PC Register)** 记录当前线程执行指令的位置。 3. **执行引擎** - **解释器**:逐行解释字节码。 - **即时编译器(JIT)**:将热点代码编译为机器码以提升性能。 - **垃圾回收器(GC)**:自动回收堆中无用对象。 4. **本地方法接口(JNI)** 调用操作系统或硬件相关的本地库。 --- #### **二、JVM运行流程** 1. **类加载**:将`.class`文件加载至方法区。 2. **内存分配**:对象实例分配在堆中,局部变量存储于虚拟机栈。 - 例如:`Object obj = new Object();`中,`obj`引用在栈中,对象实例在堆中[^2][^3]。 3. **执行字节码**:解释器或JIT将字节码转换为机器指令。 4. **垃圾回收**:GC自动回收堆中不可达对象,避免内存泄漏。 --- #### **三、垃圾回收(GC)原理** - **分代收集算法**: - **年轻代**:使用复制算法(Minor GC),Eden区满时触发。 - **老年代**:使用标记-清除或标记-整理算法(Major GC/Full GC)[^3]。 - **GC Roots**:通过根对象(如栈中局部变量、静态变量)判断对象存活性。 --- #### **四、关键特性** 1. **跨平台性**:字节码通过JVM适配不同操作系统。 2. **内存自动管理**:GC减少内存泄漏风险。 3. **多线程支持**:独立栈和程序计数器实现线程隔离。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值