JVM基础知识和垃圾回收算法_jvm基础知识,垃圾回收,常用算法-优快云博客

本文链接：https://blog.youkuaiyun.com/weixin_46002185/article/details/114935843

本文详细介绍了JVM的运行时数据区域，包括程序计数器、Java虚拟机栈、本地方法栈、Java堆、方法区等内容。同时，还探讨了垃圾回收机制、对象的内存布局及访问方式。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

JVM运行时数据区域

在这里插入图片描述

1.程序计数器
内存空间小，线程私有。字节码解释器的工作就是通过改变这个计数器的值来选取下一条需要执行指令的字节码指令，分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖程序计数器完成。
如果线程正在执行一个java方法，这个计数器记录的是正在执行的虚拟机字节码指令的地址；如果正在执行的是一个native方法，这个计数器的值为(Undefined)。此内存区域是唯一一个在java虚拟机规范中没有规定任何OutOfMemoryError的区域。
2.Java虚拟机栈
线程私有，生命周期和线程一致。描述的是java方法执行的内存模型：每个方法执行时都会创建一个栈帧（Stack Frame）用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从调用直至执行结束，就对应着一个栈帧从虚拟机栈中入栈到出栈的过程。
局部变量表，存放了编译器可知的各种基本类型（boolean,byte,char,short,int,float,double,long），引用对象（reference类型）和returnAddress类型（指向了一条字节码指令地址）
StackOverflowError:线程请求的栈深度大于虚拟机所允许的深度。
OutOfMemoryError:如果虚拟机栈可以动态扩展，而扩展时无法申请到足够的内存。
3.本地方法栈
区别于java虚拟机栈的是，java虚拟机栈为虚拟机执行java方法（也就是字节码）服务，本地方法栈则为虚拟机使用到的native方法服务。也会有StackOverflowError和OutOfMemoryError。
4.java堆
对于绝大多数应用来说，这块区域是JVM所管理的最大的一块。线程共享，主要存放对象和数组，内部会划分出多个线程私有的分配缓冲区（Thread Local Allocation Buffer, TLAB），可以位于物理上不连续的空间，但是逻辑上要连续。
OutOfMemoryError:如果堆中没有足够的空间实例分配，并且堆也无法再扩展时，抛出该异常。
5.方法区
属于共享内存区域，存储已被加载的类信息、常量、静态变量、即时编译器编译的代码等数据。

在这里插入图片描述

6.运行时常量池
属于方法区的一部分，用于存放编译期生成的各种字面量和符号引用，内存有限，无法申请时抛出OOM。
7.直接内存
非虚拟机运行时内存。

对象的内存布局（HotSpot 虚拟机）

  对象头（header）:包含两部分，第一部分用于存储对象自身的运行时数据，如哈希码、GC分代年龄、锁状态标志、线程持有的锁、偏向线程 ID、偏向时间戳等32位虚拟机占 32 bit，64 位虚拟机占64bit。官方称为‘MarkWord’。第二部分是类型指针，即对象指向它的类的元数据指针，虚拟机通过这个指针确定对象是哪个类的实例，另外，如果是java数组，对象头中还必须有一块用于记录数组长度的数据，因为普通对象可以通过Java对象元数据确定大小，而数组对象不可以。
  实例数据（instance data）: 代码中所定义的各种类型字段的数据，包括继承自父类的和自己定义的。
  对齐数据（padding）:不是必然需要，主要是占位，保证对象大小是某个字节整数倍。

对象的访问定位

  通过java虚拟机栈上的reference数据来操作具体对象

1.通过句柄访问
java堆中会分配一块内存作为句柄池，reference存储的是句柄地址。句柄地址包含到对象实例数据的指针(1)和到对象类型数据的指针(2)，(1)就在java堆的实例池中，(2)在方法区。

在这里插入图片描述

2.通过直接指针访问
reference中直接存储对象实例地址，到对象类型数据的指针与上文一样。
比较：使用句柄的最大好处是reference中存储的稳定的句柄地址在对象移动时(GC)只改变实例数据指针地址，reference自身不需要改变。直接指针访问的最大好处就是速度快，节省了一次指针定位的开销。如果是对象频繁GC，那么句柄访问好，如果是对象频繁访问，那么直接指针访问好。

在这里插入图片描述

垃圾回收概述

  程序计数器、java虚拟机栈、本地方法栈三个区域随线程生灭（因为是线程私有的），栈中的栈帧随着方法的进入和退出而有条不紊地执行入栈和出栈的操作。而java对和方法区则不一样，一个接口中的实现类需要的内存可能不一样，一个方法中的多个分支需要的内存可能也不一样，我们只有在程序处于运行期才知道哪些对象会创建，这部分内存的分配和回收都是动态的，垃圾回收期所关注的内存就是这部分。

对象已“死”吗？

  在进行内存回收之前要做的事情就是判断哪些对象是‘死’的，哪些是’活‘的。

引用计数法：给对象添加一个引用计数器，但是解决不了循环的问题，比如：在java虚拟机栈里面有两个reference引用对象a，b，分别指向java堆中的o1、o2对象，而o1\o2对象又存在相互引用的关系，如果不小心把a和b置为null，则在java堆中的两块内存依然保持着相互引用，无法回收。

在这里插入图片描述

可达性分析法：通过一系列的“GC Roots”作为起点，从这些节点出发所走过的路径称为引用链。当一个对象到“GC Roots”没有任何引用链相连的时候说明对象不可用。
可作为GC Roots的对象：

在这里插入图片描述

java虚拟机栈(栈帧中的本地变量表)中引用的对象
方法区中类静态属性引用的对象
方法区中常量引用的对象
本地方法栈中本地方法引用的对象（JNI）

引用类型
强引用：类似于Object obj = new Object();创建的，只要强引用在就不会被回收；
软引用：SoftReference 类实现软引用。在系统要发生内存溢出异常之前，将会把这些对象列进回收范围之中进行二次回收。
若引用：WeakReference 类实现弱引用。对象只能生存到下一次垃圾收集之前。在垃圾收集器工作时，无论内存是否足够都会回收掉只被弱引用关联的对象。
虚引用：PhantomReference 类实现虚引用。无法通过虚引用获取一个对象的实例，为一个对象设置虚引用关联的唯一目的就是能在这个对象被收集器回收时收到一个系统通知。
生存还是死亡
即使在可达性分析算法中不可达的对象,也并非是“facebook”的，这时候它们暂时出于“缓刑”阶段，一个对象的真正死亡至少要经历两次标记过程：如果对象在进行中可达性分析后发现没有与 GC Roots 相连接的引用链，那他将会被第一次标记并且进行一次筛选，筛选条件是此对象是否有必要执行 finalize() 方法。当对象没有覆盖 finalize() 方法，或者 finalize() 方法已经被虚拟机调用过，虚拟机将这两种情况都视为“没有必要执行”。
如果这个对象被判定为有必要执行finalize()方法，那么这个对象竟会放置在一个叫做 F-Queue的队列中，并在稍后由一个由虚拟机自动建立的、低优先级的Finalizer线程去执行它。这里所谓的“执行”是指虚拟机会出发这个方法，并不承诺或等待他运行结束。finalize()方法是对象逃脱死亡命运的最后一次机会，稍后 GC 将对 F-Queue中的对象进行第二次小规模的标记，如果对象要在 finalize()中成功拯救自己——只要重新与引用链上的任何一个对象简历关联即可。
finalize()方法只会被系统自动调用一次。
回收方法区
在堆中，尤其是新生代中，一次垃圾回收一般可回收70%——95%的空间，而永久代的垃圾回收效率远低于此，永久代垃圾主要回收两部分内容：废弃的常量和无用的类。
判断废弃常量：一般是判断没有该常量的引用；
判断废弃的类：需要满足以下三点：

该类所有的实例都已经回收，也就是在java堆中不存在该类的任何实例；
加载该类的ClassLoader已经被回收；
该类对应的java.lang.Class对象没有任何地方被引用，无法在任何地方通过反射访问该类的方法。

垃圾回收算法 (四种)

标记清除法

  两个阶段，标记阶段和清除阶段。
  在标记阶段首先通过根节点(GC Roots)，标记所有从根节点开始的对象，未被标记的对象就是未被引用的垃圾对象。然后，在清除阶段，清除所有未被标记的对象。

在这里插入图片描述

适用场合：

  1.存活对象较多的情况下比较高效。
  2.适用于老年代（即旧生代）

缺点：

  1.容易产生内存碎片，再来一个比较大的对象时（典型情况：该对象的大小大于内存中每一块大小，但是小于两块大小之和），会提前出发垃圾回收。
  2.扫描了整个空间两次（第一次标记存活对象，第二次清除没有标记的对象）。

复制算法

  从跟集合结点进行扫描，标记出所有存活的对象，并将这些存活的对象复制到一块新的内存。之后将原来那一块内存全部回收掉。

现在的商业虚拟机都采用这种算法来回收新生代。

在这里插入图片描述

适用场合：

  1.存活对象较少的情况下比较高效；
  2.扫描了整个空间一次（标记存活对象并复制移动）。
  3.适用于年轻代（即新生代），基本上98%的对象都是“朝生夕死”的，存活下来的会很少。

缺点：

  1.需要一块空的存储空间；
  2.需要复制移动对象。

标记整理

  复制算法的高效性是建立在存活对象少，垃圾对象多的前提下的。这种情况在新生代经常发生，但是在老年代更常见的情况是大部分对象都是存活对象。如果依然使用复制算法由于存活的对象较多，复制的成本也高。
  标记-压缩算法是一种老年代的回收算法，它在标记-清除算法的基础上做了一些优化。
  首先也需要从根节点开始对所有可达对象做一次标记，但之后，它并不简单的清除未标记的对象，而是将所有存活的对象压缩到内存的一端。之后，清理边界外所有空间。这种方法既避免了碎片的产生，又不需要两块相同的内存空间，因此，其性价比 较高。

在这里插入图片描述

分代收集算法

  分代收集算法就是目前虚拟机使用的回收算法。
  将内存分为各个年代，一般情况下将堆去划分为老年代（Tenured Generation）和新生代（Young Generation），在堆区之外还有一个永久代（Permanet Generation）。
  在不同年代使用不同的算法从而使用最合适的算法，新生代存活率低，可以使用复制算法，老年代对象存活率高，使用标记清除法和标记整理（压缩）法

在这里插入图片描述