JVM深入解析-优快云博客

JVM概述

作用

构成部分

类加载子系统

作用:

类加载器子系统负责从文件系统或者网络中加载 class 文件。

主负责加载类, 有执行引擎执行,存放在方法区(元空间)

扮演者的是一个快递员的角色

类加载过程

1.加载

根据类的地址,从硬盘上读取类的信息,

将信息读入到方法区,生成Class类的对象

2.链接

验证: 验证字节码文件格式是否是当前虚拟机所支持的文件格式,语法格式

准备: 为静态成员分配默认值(int 默认值0) 注意static final在编译期间赋值

解析: 将字节码中符号引用替换成直接引用

例如: 编写代码方法1 中调用方法2 (符号引用)

类加载到内存后把符号的引用地址换成内存的地址引用

3.初始化

类什么时候初始化?

1 )创建类的实例，也就是 new 一个对象

2）访问某个类或接口的静态变量，或者对该静态变量赋值

3）调用类的静态方法

4）反射（Class.forName(“”)）

5）初始化一个类的子类（会首先初始化子类的父类）

类的初始化顺序

先初始化静态的,多个静态的按照从上向下的顺序执行,

如果类有父类,则先初始化父类的静态,然后是子类.

如果是创建对象,先调用父类的构造方法,然后是子类自己的构造方法

类加载器

站在JVM的角度划分: 启动类加载器(不是java语言写的),

其他类加载(都是java语言写的)

站在开发者的角度:

启动类加载器(引导类加加载器)

这个类加载器使用 C/C++语言实现,嵌套在 JVM 内部.它用来加载 java 核心类

库.

负责加载扩展类加载器和应用类加载器

加载<JAVA_HOME>\lib

扩展类加载类器

是由java语言实现的继承自ClassLoader

负责加载 D:\ProgramFiles\Java\jdk1.8.0_261\jre\lib\ext

应用程序类加载器(系统类加载器)

Java 语言编写的,由 sun.misc.Launcher$AppClassLoader 实现.

派生于 ClassLoader 类.

负责加载用户类

用户自定义类加载器(例如tomcat)

双亲委派机制

类的加载时按需加载,使用时才会加载.

类加载时,加载器都会将类交给父级类加载器加载.

如果所有的父级加载没有找到类,

则一级一级的向下委派查找.

如果都找不到,那么就会抛出异常.

目的: 为了安全考虑避免了用户自己写的类覆盖了系统中的类.

类的主动使用和被动使用

主动使用会触发类的初始化

new

使用静态变量静态方法

反射加载类

执行main方法

子类被初始化父类也会触发初始化

被动使用不会触发了类的初始化

仅仅使用类的静态常量而且是直接赋字面量的那种

将类作为数组的类型声明使用时不会触发初始化

JVM 运行时数据区

堆,方法区(元空间) 主要用来存放数据是线程共享的.

程序计数器,本地方法栈,虚拟机栈是运行程序的,是线程私有的.

程序计数器

jvm中的程序计数器不是cpu中的寄存器, 可以理解为计数器.

是一块非常小的内存空间,运行速度是最快的,不会出现内存溢出情况.

作用:记录当前线程中的方法执行的位置. 以便于cpu在切换执行时,记录程序执行的为位置.

在运行时数据区中唯一一个不会出现内存溢出的区域.

本地方法栈

当我们在程序中调用本地方法时,会将本地方法加载到本地方法栈中执行.

也是线程私有的, 如果空间不够,也会出现栈溢出错误. hashCode();

虚拟机栈

背景: java为了移植性好(跨平台) 所以将运行程序的设计架构为栈结构运行, 而不是依赖于cpu的寄存器架构.

栈是运行时的单位(加载方法运行),

而堆是存储的单位(存储对象的).

作用运行方法一个方法就是一个栈帧. 栈帧中包含( 局部变量(基本类型,引用地址) 方法地址,返回地址)

栈中的操作入栈,出栈栈中异常 StackOverflowError：线程请求的栈深度大于虚拟机所允许的深度。递归调用方法次数过多\

栈中存储方法运行时需要的数据

栈的运行原理第一个方法被加载入栈在方法中调用了其他方法, 另一个方法入栈方法运行结束后出栈.

栈帧的结构: 局部变量表: 方法参数,定义的局部变量, 基本值类型直接存值, 引用类型存地址.

操作数栈

动态链接

方法返回地址

Java 堆

概述

堆是JVM内存中核心的区域,用来存储创建出来的对象,是线程共享的.

堆空间在jvm启动时被创建,大小可以设置.

物理上不是连续的,逻辑上是连续的空间

堆中会发生垃圾回收.

堆内存区域划分

堆内存划分为:

新生代(新生区)

新生代分为: 伊甸园区(新生成的对象存储)

幸存者0 (from)

幸存者1(to)

老年代(老年区)

为什么要分区?

把不同的生命周期的对象存储在不同区域,这样不同的区域可以使用不同的垃圾回收算法,

可以提高垃圾回收的效率.

对象在堆内存中的的过程:

新建的对象存放在伊甸园区, 第一次垃圾回收时,垃圾对象直接被回收掉, 存活下来的对象,会把他存放到幸存者0/幸存者1.

再次垃圾回收时,把在幸存者0区存活的对象移动到幸存者1区,然后将幸存者0区清空,依次交替执行.

每次保证有一个幸存者区域是空的,内存是完整的.

当对象经过15次垃圾回收后,依然存活的.将被移动到老年区(老年区,垃圾回收的频率就比较低)

堆各区域的占比

新生代占整堆的三分之一

新生代中的伊甸园区幸存者0 幸存者1 占比是 8:1:1

对象经过15次垃圾回收后,依然存活的.将被移动到老年区

为什么最大是15次 , 因为在对象头中只有4个bit位的空间,只能表示最大值15.

堆空间的参数设置

一般所说JVM优化就是调整jvm相关各区的参数

https://docs.oracle.com/javase/8/docs/technotes/tools/unix/java.html

分代收集思想 Minor GC、Major GC、Full GC

一般情况下收集新生代 Minor GC/Yong GC

老年代会触发Major GC / Old GC

整堆收集 Full GC

整堆收集触发的条件:

System.gc();时

老年区空间不足

方法区空间不足

开发期间尽量避免整堆收集 ( 在垃圾回收时会STW stop the world 回收时停止其他线程运行 )

TLAB 机制

TLAB 线程本地分配缓存区

在多线程情况下,可以在堆空间中通过-XX:UseTLAB 设置. 在堆空间中为线程开辟一块空间,用来存储线程中产生的一些对象, 避免空间竞争,提高分配效率

字符串常量池位置

jdk7之前,将字符串常量池位置在方法区(永久代)中存储. jdk8之后方法区又称为元空间

jdk8之后,将字符串常量池的位置放到了堆空间. 因为方法区只有触发FUll GC时才会回收.

因为程序中大量的需要使用字符串,所以将字符串常量池的位置改变到了堆中,可以及时回收无效的字符串常量.

方法区

概述

方法区也是一块内存空间,逻辑上属于堆,为了区分,称为元空间(jdk8之后)

主要用来存储类的信息

在jvm启动时创建大小可以分配

如果加载的类太多,也会报内存溢出错误

是线程共享的.

方法区的大小可以通过 -XX:MetaspaceSize 设置

方法区在windows中默认大小是21MB

如果到达21MB会触发FULL GC

可以将其值设置的大一些,减少FULL GC的触发

方法区中主要回收运行时常量池,类的信息

类的信息卸载(回收) 条件是比较苛刻的.

满足3个条件:

1.该类以及子类的对象没有被引用

2.该类的类加载器被卸载

3.该类的LClass对象也没有被引用

本地方法接口

什么是本地方法

一个 Native Method 就是一个 java 调用非 java 代码的接口

非java语言实现的,例如 C C++

为什么要使用 Native Method

我们的java程序需要与外部(计算机硬件)进行数据交互( 例如hashCode read() start() )

可以直接调用外部的本地方法实现.

JVM解释是用C写的,可以更好的与本地方法交互.

执行引擎

前端编译( .java ---> .class)

字节码不等于机器码

需要jvm将字节码加载到内存中.

需要通过执行引擎将字节码解释/编译成机器码后端编译( .class ---> 机器码)

执行引擎机制:

解释器: 将字节码逐行解释执行

JIT编译器(即时编译器): 将字节码整体编译为机器码执行

为什么JVM执行引擎设计为半解释型,半编译型?

逐行解释执行效率低.

JVM会针对使用频率较高的热点代码进行编译,并缓存起来. 执行效率提高.

但是编译是需要消耗时间的.

所以jvm刚刚启动后,可以先通过解释器解释执行代码.

之后再使用编译器编译执行. 两种结合在一起.

垃圾回收

概述

垃圾收集机制并不是java语言首创的.

但是又是java的招牌, java可以自动垃圾回收.

垃圾回收:

回收哪些区域频繁回收堆内存,较少回收方法区 栈,本地方法栈,程序计数器没有垃圾回收

什么时候回收

怎么回收

什么是垃圾

垃圾是指在运行程序中没有任何引用指向的对象，这个对象就是需要被回收的垃

圾。

为什么需要 GC？

垃圾如果不及时清理,越积越多,可能会导致内存溢出.

垃圾多了,内存碎片较多例如数组需要连续空间

早期是手动回收不被使用的对象例如 C++

java语言是自动垃圾收集的.

垃圾回收机制

自动内存管理

无需开发人员手动参与内存的分配与回收，这样降低内存泄漏和 内存溢出的风险

以更专心地专注 于业务开发

自动收集的担忧

自动回收方便了程序员的开发,但是降低处理内存问题的能力.

自动虽好,但是还是应该了解并掌握一些相关内存管理的知识.

Java 堆是垃圾收集器的工作重点

从次数上讲：

频繁收集 Young 区

较少收集 Old 区

基本不收集元空间(方法区)

内存溢出与内存泄漏

溢出: 内存不够用了

泄漏: 有些对象已经在程序不被使用了,但是垃圾回收机制并不能判定其为垃圾对象,不能将其回收掉,

这样的对象越积越多, 长久也会导致内存不够用.

例如: 与数据库连接完之后,需要关闭连接通道,但是没有关闭.

io 读写完成后没有关闭

垃圾收集算法分为两大类:

1.垃圾标记阶段算法

主要是来判定哪些对象已经不再被使用,标记为垃圾对象.

判定对象为垃圾的标准: 不被任何引用所指向的对象. Object obj = new Object();

垃圾回收阶段算法:

引用计数算法(在jvm中不被使用)

如果有一个引用指向此对象,那么计数器加1. 如果没有引用指向,计数器为0, 此时就判定为垃圾.

优点:方便使用,设计简洁.

缺点: 增加了计数器的存储空间,计数需要消耗时间.

导致一个循环引用问题. 好几个对象之间相互引用,但是没有其他引用指向他们,此时垃圾回收不能回收他们,但是也没有引用指向. 这就造成了内存泄漏

Object obj = new Object();

obj=null;

可达性分析算法/根搜素算法(这是java目前所使用的垃圾标记算法)

解决循环引用问题, 设计简单 ,运行高效,防止内存泄漏

思路:

从一些活跃引用(GCRoots 根)开始, 如果对象被根直接或间接引用,那么此对象不是垃圾, 否则标记为垃圾对象.

哪些引用被用来当做根:

虚拟机栈中引用的对象 (方法中引用的对象)

本地方法栈中引用的对象

静态变量所引用的对象

常量引用指向的对象

被synchronized当做锁的对象

Java 虚拟机内部的引用

总结: 栈中引用的(正在使用的) 方法区,常量池中(生命周期较长的),被synchronized当做锁的对象

final(关键字) finally(代码块) finalize()(方法) 是Object类中的一个方法,在对象被最终回收之前调用,只调用一次.

八股文--->背理解了背一遍就记住了加入想法,上升到一个全局思想. 不理解天天背也不理解

finalize() 方法机制

java允许对象在销毁前去调用finalize(),去处理一些逻辑. 一般不用(不建议用)

不要自己显示的去调用finalize()方法,在里面写代码一定要慎重

在 finalize()时可能会导致对象复活。

finalize()由垃圾回收器调用,没有固定的时间.

一个糟糕的 finalize()会严重影响 GC 的性能。比如 finalize 是个死循环。

对象状态:

可触及的：从根节点开始，可以到达这个对象。 (没有被标记为垃圾)

可复活的：对象的所有引用都被释放，但是对象有可能在 finalize()中复活。确定为垃圾了,但没有调用finalize()方法.

不可触及的：对象的 finalize()被调用，并且没有复活，那么就会进入不可触及状态。不可触及的对象不可能被复活，因为 finalize()只会被调用一次.

2.垃圾回收阶段算法

1.标记-清除算法

分为两个阶段:

标记: 标记出从根可达的对象,标记的是被引用的对象.

清除: 此清除并非直接将垃圾对象清除掉.

而是将垃圾对象的地址维护到一个空闲列表中,

之后如果有新的对象产生,判断空闲列表中的对象空间能否存放得下新的对象,如果能放得下,那么就覆盖垃圾对象.

优点: 简单,容易理解

缺点: 效率低, 会产生STW(在回收时,停止整个应用程序), 会产生内存碎片.

2.复制算法

将内存分为大小相等的两块,每次只使用其中的一块儿区域即可.

当回收时,将不是垃圾的对象,复制到另一块内存中,排放整齐.

然后将原来的内存块清空.

减少内存碎片.

优点: 运行高效,减少内存碎片

缺点: 用到两倍的内存空间 ,对于G1垃圾回收器,将每个区域又可以拆分成更多的小区域,需要维护各区之间的关系.

在新生代中的幸存者0和幸存者1这两个区域使用复制算法.

3.标记压缩算法

背景:

复制算法需要移动对象位置,移动的数量如果多的情况下,效率低. 对于年轻代来讲还是不错的.

对于老年代,大量的对象是存活的. 如果需要移动就比较麻烦效率低.

实现:

将存活对象标记出来,重新在本内存空间中排放位置.

清除其他空间的垃圾对象.

标记-清除和标记-压缩对比

标记清除是不移动对象, 不会把垃圾对象清除掉(维护在一个空闲列表中)

标记-压缩是要移动对象的. 要清除掉垃圾对象.

优点: 不会像标记-清除算法那样会产生内存碎片

不会像复制算法那样需要两块内存空间

缺点:

效率相对低, 对象位置移动后需要重新设置对象地址, 也会有STW

分代/分区收集

由于对象的生命周期长短不同,将不同的对象存储在不同的区域.

针对不同的区域进行分区收集,提高收集效率.

垃圾回收中的相关概念

System.gc() 的理解

调用System.gc()方法,会触发FULL GC(整堆收集),

但是不一定调用后会立刻生效,因为垃圾回收是自动的.

一般情况下,不要在项目中显示的去调用.

Stop the World

Stop the World -->STW 在垃圾回收时,会导致整个应用程序停止.

在标记垃圾对象时,需要以某个时间节点上内存中的情况进行分析(拍照快照)

因为不进行停顿的话,内存中的对象不停的变化,导致分析结果不准确.

停顿是不可避免的,优秀的垃圾回收器尽可能减少停顿的时间.

对象引用

Object obj = new Object();

就是将对象分等级: 强引用(有引用指向的对象) 软引用弱引用虚引用(都是垃圾了)

强引用: Object obj = new Object(); obj引用创建的对象那么此对象就是被强引用的.

这种情况下,即使内存不够用了,报内存溢出,也不会回收.

软引用: 当内存足够使用时,先不回收这类对象,当虚拟机内存不够用时,要回收此类对象.

弱引用: 此类对象只能生存到下次垃圾回收时, 只要发生垃圾回收,就会回收此类对象.

虚引用: 发现即回收.

内存溢出与内存泄漏

垃圾回收器

比较底层,了解垃圾回收器的一些种类及实现.

垃圾回收器(具体实现垃圾回收的收集器名称)

垃圾回收器分类

按线程数分，可以分为串行垃圾回收器和并行垃圾回收器

按照工作模式分，可以分为并发式垃圾回收器和独占式垃圾回收器

按工作的内存区间分，又可分为年轻代垃圾回收器和老年代垃圾回收器

垃圾回收器的性能指标

吞吐量：运行用户代码的时间占总运行时间的比例（总运行时间：程序的运

行时间+内存回收的时间）

垃圾收集开销：垃圾收集所用时间与总运行时间的比例。

暂停时间：执行垃圾收集时，程序的工作线程被暂停的时间。

收集频率：相对于应用程序的执行，收集操作发生的频率。

内存占用：Java 堆区所占的内存大小。

快速：一个对象从诞生到被回收所经历的时间。

常见的垃圾收集器