JVM探究
- 请你谈谈你对JVM的理解?java8虚拟机和之前的变化?
- 什么是OOM?什么是栈溢出StackOverFlowError?怎么分析?
- JVM的常用调优参数有哪些
- 内存快照如何抓取,怎么分析Dump文件?知道吗?
- 谈谈JVM中,类加载器你的认识?rt.jar ext
一、JVM的位置
二、JVM的体系结构
三、类加载器
作用:加载class文件,new Student()
1. 虚拟机自带的加载器
2. 启动类(根)加载器(BOOT) 加载类容:rt.jar
3. 扩展类加载器(EXC) 加载类容: jre\ilb\ext
4. 应用程序加载器(APP)
四、双亲委派机制
BOOT->EXC->APP ,优先从高到低加载使用其中的类
五、沙箱安全机制
什么是沙箱?
Java安全模型的核心就是Java沙箱(sandbox),什么是沙箱?沙箱是一个限制程序运行的环境。沙箱机制就是将 Java 代码限定在虚拟机(JVM)特定的运行范围中,并且严格限制代码对本地系统资源访问,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。沙箱主要限制系统资源访问,那系统资源包括什么?——CPU、内存、文件系统、网络
。不同级别的沙箱对这些资源访问的限制也可以不一样。
所有的Java程序运行都可以指定沙箱,可以定制安全策略。
java中的安全模型:
在Java中将执行程序分成本地代码和远程代码两种,本地代码默认视为可信任的,而远程代码则被看作是不受信的。对于授信的本地代码,可以访问一切本地资源。而对于非授信的远程代码在早期的Java实现中,安全依赖于沙箱 (Sandbox) 机制。如下图所示 JDK1.0安全模型
但如此严格的安全机制也给程序的功能扩展带来障碍,比如当用户希望远程代码访问本地系统的文件时候,就无法实现。因此在后续的 Java1.1 版本中,针对安全机制做了改进,增加了安全策略
,允许用户指定代码对本地资源的访问权限。如下图所示 JDK1.1安全模型
在 Java1.2 版本中,再次改进了安全机制,增加了代码签名
。不论本地代码或是远程代码,都会按照用户的安全策略设定,由类加载器加载到虚拟机中权限不同的运行空间,来实现差异化的代码执行权限控制。如下图所示 JDK1.2安全模型
当前最新的安全机制实现,则引入了域 (Domain) 的概念。虚拟机会把所有代码加载到不同的系统域和应用域,系统域部分专门负责与关键资源进行交互,而各个应用域部分则通过系统域的部分代理来对各种需要的资源进行访问。虚拟机中不同的受保护域 (Protected Domain),对应不一样的权限 (Permission)。存在于不同域中的类文件就具有了当前域的全部权限,如下图所示 最新的安全模型(jdk 1.6)
以上提到的都是基本的Java 安全模型概念
,在应用开发中还有一些关于安全的复杂用法
,其中最常用到的 API 就是 doPrivileged。doPrivileged 方法能够使一段受信任代码获得更大的权限,甚至比调用它的应用程序还要多,可做到临时访问更多的资源
。有时候这是非常必要的,可以应付一些特殊的应用场景。例如,应用程序可能无法直接访问某些系统资源,但这样的应用程序必须得到这些资源才能够完成功能。
组成沙箱的基本组件:
-
字节码校验器
(bytecode verifier):确保Java类文件遵循Java语言规范。这样可以帮助Java程序实现内存保护。但并不是所有的类文件都会经过字节码校验,比如核心类。 -
类装载器(class loader):其中类装载器在3个方面对Java沙箱起作用
- 它防止恶意代码去干涉善意的代码;//双亲委派机制
- 它守护了被信任的类库边界;
- 它将代码归入保护域,确定了代码可以进行哪些操作。
虚拟机为不同的类加载器载入的类提供不同的命名空间,命名空间由一系列唯一的名称组成,每一个被装载的类将有一个名字,这个命名空间是由Java虚拟机为每一个类装载器维护的,它们互相之间甚至不可见。
类装载器采用的机制是双亲委派模式。
- 从最内层JVM自带类加载器开始加载,外层恶意同名类得不到加载从而无法使用;
- 由于严格通过包来区分了访问域,外层恶意的类通过内置代码也无法获得权限访问到内层类,破坏代码就自然无法生效。
-
存取控制器
(access controller):存取控制器可以控制核心API对操作系统的存取权限,而这个控制的策略设定,可以由用户指定。 -
安全管理器
(security manager):是核心API和操作系统之间的主要接口。实现权限控制,比存取控制器优先级高。 -
安全软件包
(security package):java.security下的类和扩展包下的类,允许用户为自己的应用增加新的安全特性,包括:
- 安全提供者
-
消息摘要
- 数字签名 keytools https
- 加密
- 鉴别
六、Native
**说明:**凡是带了Native关键字的方法,说明java作用范围达不到了,会去调用底层c语言的库。
凡是带了Native关键字的方法会进入本地方法栈,会调用java本地方法接口JNI**(JAVA NATIVE INTERFACE)。**
**JNI作用:**扩展java的使用,融合不同的编程语言为java所用。java诞生的时候,c、c++横行,想要立足,必须要有调用c、c++的程序,融合c、c++。于是它在内存区域中专门开辟了一块标记区域:Native Method Stack,登记native方法,在执行引擎(Execution Engine)执行的时候,加载本地方法库(Native Libraries)
目前该方法的使用的越来越少了,除非与硬件有关的引用,比如通过java驱动打印机或者java系统管理生产设备,在企业应用中比较少见,因为现在的异构领域间通信很发达,比如可以使用Socket通信,也可以使用Web Service等等,不多做介绍。
Native Method Stack
它的具体做法是在Native Method Stack中登记native方法,在执行引擎(Execution Engine)执行的时候,加载本地方法库(Native Libraries)【本地库】
七、PC寄存器
程序计数器:Program Counter Register
每个线程都有一个程序计数器,是线程私有的,就是一个指针,指向方法区的方法字节码(用来存储指向像一条指令的地址,也即将要执行的指令代码),在执行引擎读取下一条指令,是一个非常小的内存空间,几乎可以忽略不计。
八、方法区
Method Area方法区
方法区是被所有线程共享,所有字段和方法字节码,以及一些特殊方法,比如构造函数,接口代码也再此定义,简单说,所有定义的方法的信息都保存在该区域,此区域属于共享区间‘
静态变量、常量、类信息(构造方法、接口定义)、方法、运行时的常量池存在方法区中,但是实例变量存在堆内存中,与方法区无关。即:static、final、Class、常量池。
九、栈
程序=数据结构+算法:持续学习
程序=框架+业务逻辑:吃饭~
队列:先进先出(FIFO:First Input First Output)
栈:先进后出、后进先出:桶。
1. 这是为什么main()方法先执行,最后结束。
2. 栈内存,主管程序运行,生命周期和线程同步;线程结束,栈内存就会释放;对于栈来说不存在垃圾回收问题,一旦线程结束,栈就结束。迭代会造成栈溢出。
3. 栈中存放8大基本类型、对象引用、实例方法。
4. 栈的运行原理:栈帧;每执行一个方法,都会产生一个栈帧。
如果栈满了,会抛出StackOverflowError
- 栈+堆+方法区:交互关系
十、三种JVM
-
Sun公司 HotSpot : 现在我电脑的java -version:Java HotSpot™ 64-Bit Server VM (build 25.131-b11, mixed mode)
-
BEA : JRockit。基本JRockit JVM是世界上最快的JVM。
-
IBM(IBM J9 VM) :IBM Java平台是以Oracle开发的Java Technology 为基础实现的,IBM 提供了两个安装程序包:
IBM Software Developers Kit(SDK)
Java Runtime Environment(JRE)
十一、堆
Heap,一个jvm只有一个堆内存,堆内存的大小是可以调节的。
类加载器读取了类文件后,一般会把什么东西放在堆中?类,方法,常量,变量~,保存我们所有引用类型的真实对象;
堆内存中还要细分为三个区域:
- 新生区(伊甸园Eden Space)
- 养老区
- 永久区
GC垃圾回收,主要是在伊甸园区和养老区。
假设内存满了,会报错OOM,堆内存不够!java.lang.OutofMemoryError:java heap space
在jdk8以后,永久存储区改了个名字叫元空间。
新生区(eden space, from space, to space)
- 类:诞生和成长的地方,甚至死亡;
- 伊甸园区,所有的对象是在伊甸园区new出来的。当伊甸园区满了,触发轻gc(Minor GC)会进行垃圾回收,没有被回收的对象,进入幸存区(幸存0区和幸存1区是动态交换的)。
- 幸存区(0,1)
- 新生区回收不掉的,进入养老区。
- 真理:经过研究,99%的对象都是临时对象,在新生区会就被垃圾回收!
养老区
- 当养老区满了,会引发Full GC,Full GC将会同时回收年轻代、年老代,
永久区
这个区域常驻内存的,用来存放JDK自身携带的Class对象。Interface元数据,存储的是java运行的一些环境。这个区域不存在垃圾回收,关闭jvm虚拟就会释放这个区域的内存。
一个启动类,加载大量第三方架包。tomcat部署了太多的应用,大量动态生成的反射类,不断的被加载,直到我们内存满,就会出现OOM。
- 当永久代满时也会引发Full GC,会导致Class、Method元信息的卸载。
- jdk1.6之前:永久代,常量池在方法区中。
- jdk1.7 :永久代,但是慢慢的退化了,去永久代,常量池在堆中。
- jdk1.8之后:无永久代,常量池在元空间的方法区。
元空间在逻辑上存在,物理上不存在。是一个叫非堆的堆。
另一种说法:元空间用的是本地内存,不是jvm内存。
默认情况下,jvm分配的总内存是电脑内存1/4,而初始化内存是1/64.
问题:在一个项目中,突然出现了OOM故障,那么该如何排除,研究为什么出错
-
最快:能够看到第几行出错。工具:内存快照分析工具,MAT,Jprofiler
-
最慢:Debug,一行行分析代码!
MAT,Jprofiler作用:
- 分析Dump内存文件,快速定位内存泄漏。
- 获得堆中的数据
- 获得大的对象~
- …
//-Xms 设置初始化内存分配大小。默认1/64。
//-Xmx 设置最大分配内存。默认1/4。
//-XX:+PrintGCDetails 打印GC垃圾回收信息
//-XX:+HeapDumpOnOutOfMemoryError //oom DUMP
//-Xms1m -Xmx8m -XX:+HeapDumpOnOutOfMemoryError
public class Demo03 {
Byte[] bytes = new Byte[1 * 1024 * 1024];
public static void main(String[] args) {
ArrayList bytes1 = new ArrayList();
int count = 0;
try {
while (true) {
bytes1.add(new Demo03());
count++;
}
} catch (Error e) {
System.out.println(count);
e.printStackTrace();
}
}
}
十二、GC
JVM在进行GC时,并不是对这三个区域统一回收,大部分时候,回收都是新生代。
-
新生代
-
幸存区(from,to),谁空谁是to。
-
老年区。当一个对象经历了15次GC,都没有死,会进入老年区。
-XX:MaxTenuringThreshold=5:通过这个参数,可以设定进入老年代的时间。
GC两类:轻GC(普通的GC,Minor GC),重GC(全局GC,Full GC)
题目:
- JVM内存模型和分区,详细到每个区放什么?
- 堆里面的分区有哪些?Eden,from,to,老年区,说说他们的特点!
- GC的算法有哪些?标记清除法,标记整理法,复制算法,引用计数器,怎么用的?
- 轻GC和重GC分别在什么时候发生?
引用计数法
记录每个对象的使用次数。
复制算法
- 每次GC都会将Eden活的对象移动到幸存区中,一旦Eden区被GC后,就会是空的!幸存区的from和to,谁空谁是to。
- 幸存区的from和to,谁空谁是to。当幸存区的from和to都有值的时候,会将from里面的复制到to中,from就会变成to。
- 好处:没有内存的碎片~
- 坏处:浪费了内存空间~:多了一半空间永远是空to,假设对象100%存活(极端情况)
想要复制算法最佳使用场景:对象使用存活较低的时候:新生区
标记清除算法
- 优点:不需要额外的空间。
- 缺点:两次扫描,严重浪费时间,会产生内存碎片,hash
标记压缩算法
是标记清除算法的再优化。
再优化方案:先标记清除多次,再进行标记压缩。
总结
内存效率:复制算法>标记清除算>标记压缩算法(时间复杂度)
内存整齐度:复制算法=标记压缩算法>标记清除算法
内存利用率:标记压缩算法=标记清除算法>复制算法
-
思考:难道没有最优算法吗?
答案:没有最好的算法,只有最合适的算法。
GC:分代收集算法。
年轻代:存活率低,使用复制算法。
老年代:区域大,存活率高;
使用标记清除(内存碎片不是太多)+标记压缩 混合实现。
十三、JMM:Java Memory Model
- 什么是JMM
【JMM】(Java Memory Model的缩写)允许编译器和缓存以数据在处理器特定的缓存(或寄存器)和主存之间移动的次序拥有重要的特权,除非程序员使用了volatile或synchronized明确请求了某些可见性的保证。
- 它是干嘛的?:官方,博客,视频,懂?
作用:缓存一致性协议,用于定义数据读写的规则(遵守,找到这个规则)。
jvm定义了线程工作内存和主内存之间的抽象关系:线程之间的共享变量存储在主内存(Main Memory)中,每个线程都有一个私有的本地内存(Local Memory)。
解决共享对象可见性这个问题:volilate
- 它该如何学习?
JMM:抽象的概念,理论。
Java内存模型还规定了在执行上述八种基本操作时,必须满足如下规则:
- 如果要把一个变量从主内存中复制到工作内存,就需要按顺寻地执行read和load操作, 如果把变量从工作内存中同步回主内存中,就要按顺序地执行store和write操作。但Java内存模型只要求上述操作必须按顺序执行,而没有保证必须是连续执行。
- 不允许read和load、store和write操作之一单独出现
- 不允许一个线程丢弃它的最近assign的操作,即变量在工作内存中改变了之后必须同步到主内存中。
- 不允许一个线程无原因地(没有发生过任何assign操作)把数据从工作内存同步回主内存中。
- 一个新的变量只能在主内存中诞生,不允许在工作内存中直接使用一个未被初始化(load或assign)的变量。即就是对一个变量实施use和store操作之前,必须先执行过了assign和load操作。
- 一个变量在同一时刻只允许一条线程对其进行lock操作,但lock操作可以被同一条线程重复执行多次,多次执行lock后,只有执行相同次数的unlock操作,变量才会被解锁。lock和unlock必须成对出现
- 如果对一个变量执行lock操作,将会清空工作内存中此变量的值,在执行引擎使用这个变量前需要重新执行load或assign操作初始化变量的值
- 如果一个变量事先没有被lock操作锁定,则不允许对它执行unlock操作;也不允许去unlock一个被其他线程锁定的变量。
- 对一个变量执行unlock操作之前,必须先把此变量同步到主内存中(执行store和write操作)。
学习新东西是常态:
- netty
- Spring Cloud Alibaba