抄一段上周末读到的话:
不管是学习某门技术,还是讨论某个事情,最好的方式一定不是一头扎到具体的细节里,而是应该从时空的角度先了解它的来龙去脉,以及它为什么会演化成现在的状态。当你深刻理解了这些前因后果之后,再去看现状,就会明朗很多,也能更直接地看到现状背后的本质。
抄了Ta做的图:https://www.cnblogs.com/wcd144140/p/5624063.html
不能太纠结于图好不好看了,炒鸡费时间呢~
Java的历史和构成
当我们在使用一门技术时,如果不在依赖书本和他人就能得到这些问题的答案,那才算上升到了”不惑“的境界。
说起来,开始学Java的时候胡乱看了些网络教程,当时讲啥是JDK,啥是JRE的时候,我是字都认得,图画的也特别好,但是都没看懂(不知方丈你说啥)。现在看上去说着同一件事情的话,没说到重点上的那句,重复再多也到不了心坎。
Java技术体系
按照技术所服务的领域来划分,Java体系可以分为四个平台:
- Java Card:支持Java小程序运行在小内存设备上的平台。
- Java ME:支持Java程序运行在移动端的平台,精简版。
- Java SE:桌面级应用的Java平台。提供了完整的Java核心API。
- Java EE:支持多层架构的企业应用的Java平台,处理Java SE API外,还对其做了大量的扩充并提供了相关部署支持。
就是下载JDK的时候左边栏那一列写的(其实还没搞清楚为啥要下Java SE,我就开始写Java的hello world了)。

官方定义:
- Java 语言
- Java虚拟机
- Class文件格式
- API类库
- 第三方Java类库
比较清楚的定义:
JDK:用于支持Java程序开发
的最小环境。Java语言、虚拟机、API类库统称JDK。
JRE:用于支持Java程序运行
的标准环境。API类库中的Java SE API子集和Java虚拟机。
Java和Java虚拟机发展史
读后感:HotSpot优秀又好运……
内存区域与内存溢出异常
运行时数据
用图比较清楚的说~

计数器是唯一一个没有定义OutOfMemoryEror的区域。
对象的创建
虚拟机遇到一条new指令时会进行下面的操作。

补充一点:Java堆是否规整由所采用的垃圾收集器是否带有压缩整理功能决定。Mark-compact方法的收集器采用空闲列表,Mark-sweep方法的采用指针碰撞。
对象的内存布局

对象头中用来表示不同状态的标志位及不同状态下的存储内容如下:
状态 | 标志位 | 存储内容 |
---|---|---|
未锁定 | 01 | 对象哈希码、对象分代年龄 |
轻量级锁定 | 00 | 指向锁记录的指针 |
膨胀 | 10 | 指向重量级锁的指针 |
GC标记 | 11 | 空,不需要记录信息 |
可偏向 | 01 | 偏向线程ID、偏向时间戳、对象分代年龄 |
【Q】关于此部分的一个疑问是:对象状态发生变化的时候,对象头存储的内容是会变化的,那关于对象的完整的信息是在哪里记录了然后根据状态变化,存储到对象头中的呢?
对象的访问定位
Java程序需要通过栈上的reference数据来操作堆上的具体对象。引用
定位、访问对象的方式取决于虚拟机实现。主流的有两种:
- 使用句柄访问:reference存储的是稳定的句柄,对象被移动时,只会改变聚丙种的实例数据指针,reference不需要改变。
- 使用直接指针访问:速度快,节省了一次指针定位开销。
![]() |
![]() |
异常测试
根据各个区存储的内容来进行异常测试
- Java堆溢出:Java堆存储对象实例,可以通过创建对象实例,并保证其可达性来塞满Java堆。
- 虚拟机栈和本地方法栈溢出:递归函数 + 临时变量。
- 方法区和运行时常量池溢出:方法区存放Class的相关信息,通过运行时产生大量的类去填满方法区,直到溢出。常量池用String.intern()
- 直接内存溢出:持续使用DirectByteBuffer分配内存。
垃圾收集器与内存分配策略
GC要完成的三件事情:
- 哪些内存需要回收
- 什么时候回收
- 如何回收
因为线程隔离数据区(计数器、虚拟机栈、本地方法栈)是随着线程而生而灭的,内存分配和税后都具备确定性,通常重点关注的是Java堆和方法区的内存分配和回收。
确定对象可回收方法
- 引用计数法:实现简单、效率高,但无法解决对象之间互相循环引用的问题。(是活在教科书中的方法呢)
- 可达性分析算法:
通过一系列“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链,当一个对象到GC Roots没有任何引用链相连时,证明此对象是不可用的。

可作为GC Roots的对象有:
- 虚拟机栈中引用的对象
- 方法区中类静态属性引用的对象
- 方法区中常量引用的对象
- 本地方法栈中的JNI(Native方法)引用的对象
可达性分析后判定对象可回收的流程如下:

【方法区回收】
Java虚拟机规范无明确回收要求,性价比低。
回收内容:废弃常量、无用类。
判断方法:
- 废弃常量:与回收Java堆对象类似,看引用。
- 无用类:
- Java堆中不存在该类的任何实例
- 加载该类的Class Loader被回收
- 该类对应的java.lang.Class对象没有再任何地方被引用,无法在任何地方通过反射访问该类的方法。
垃圾收集算法
- 标记-清除 Mark-Sweep
标记出所有需要回收的对象,标记完成后统一回收。
缺点:1、标记和清除效率都不高;2、标记清楚之后会产生大量不连续的内存碎片,需要分配较大对象但无法找到连续内存的时候会在此触发垃圾收集动作。

- 复制算法
将内存按容量划分为相等两块,每次使用一块,空间不够就将还存活的对象复制到另一块上,清理一半的空间即可。
缺点:内存利用率变低。存活率较高时需要进行较多的复制操作,效率会变低。

改进:根据98%新生对象“朝生夕死”的特点,从内存对半分改为按比例分多块。

- 标记-整理
标记过程不变,后续步骤变成让存活的对象都向一段移动,然后清理掉端边界以外的内存。

- 分代收集
根据对象存活周期的不同,将内存划为几块,Java堆分为新生代和老年代,根据各年代的特点采用适当的收集算法。
HotSpots算法实现
几个概念:
- GC停顿 -
Stop The World
为保证可达性分析结果的正确性,在枚举根节点的时候必须停顿所有Java执行线程。
因为枚举根节点需要检查所有执行上下文和全局引用位置,HotSpot中使用一组成为OopMap的数据结构来实现快速定位,类加载完成就可以得到对象内什么偏移量上是什么类型的数据。GC扫描时就可以直接使用这些信息。 - 安全点
引用关系变化时,需要修改OopMap,如果为每一条指令都生成对应的OopMap,则需要大量的额外空间。OopMap存储的是特定点的信息,这些特定点就是安全点。
GC停顿是在安全点进行。
安全点的选定标准:是否具有让程序长时间执行的特征。
确保安全点进行可达性分析准确性需要GC停顿时,所有线程均到达安全点,两种思路:- 抢先式中断:
GC发生时中断所有线程,微调未到达安全点的线程。不需要线程执行代码主动配合。 - 主动式中断:
在安全点处设置一个标志,各线程轮询标志。
- 抢先式中断:
- 安全区域
是指在一段代码片段之中,引用关系不会发生变化,在该区域的任意地方开始GC都是安全的。
主要是为了处理在安全点进行GC时,处于挂起或中断的线程的处理。(留守儿童收容所既视感)
垃圾收集器
没有万能的收集器,只有适用于具体场景的收集器。
分代收集嘛~所以收集器也是有针对性的。

连线表示可搭配使用。
- Serial收集器
突然“水中贵族,百岁山”这句广告词就出来了(想当年我也是念纸尿裤广告词特别6的同学之一)
特点:最基本、最长寿的收集器,单线程来完成垃圾收集。
优点:简单高效,没有线程交互开销,在单个CPU环境下666

- PartNew收集器
多线程的Serial。

- Parallel Scavenge
使用复制算法,并行的多线程收集器。
特点:关注点很特别——达到一个可控制的吞吐量。也叫“吞吐量优先”收集器。
吞吐量 = 运行用户代码时间 / (运行用户代码时间 + 垃圾收集时间)
Parallel提供两个参数来精确控制吞吐量
- MaxGCPauseMillis:GC停顿时间
- GCTimeRatio:垃圾收集时间占总时间的比率。
另外一个懒人参数
- UseAdaptiveSizePolicy:GC自适应调节策略。
会看上面的公式就知道这俩啥意思的吧~
-
Serial Old收集器
Serial收集器的老年版,单线程,使用标记-整理算法。和Serial一样的啦~ -
Parrallel Old收集器
Parallel Scavenge的老年版,多线程,标记-整理算法。

- CMS收集器
并发收集。基于标记-清理算法。
目标:最短GC停顿时间。
运作过程:- 初始标记 :需要Stop The World,标记GC Roots能关联的对象。
- 并发标记
- 重新标记:需要Stop The World,修正并发标记期间因用户程序继续运作而导致的标记变动的对象的记录。
- 并发清除

缺点:
1、对CPU资源非常敏感
2、无法处理浮动垃圾(清理过程中新产生的等待下次收集时才能处理的垃圾)
3、空间碎片过多(标记-清理算法的基因导致)
- G1收集器
Java堆的内存布局不同,将整个Java堆分为多个大小相等的独立区域,新生代和老年代不再是物理隔离的了,都是一部分Region的集合。
跟踪不同的Region,维护优先列表,优先回收价值最大的Region。
特点:- 并发与并行:利用多个CPU来缩短停顿时间。
- 分代收集
- 空间整合:整体上是“标记-整理”算法,局部是“复制”算法,运行期间不会产生空间碎片。
- 可预测的停顿
内存分配与回收策略
1、对象优先在Eden分配
2、大对象直接进入老年代
3、长期存活的对象将进入老年代
4、对象年龄的判定是动态的