Java面试复习---JVM(狂神版)
前言
本文是Java面试复习系列中的JVM,后面会陆续有该系列其他篇章,并且会一直维护。本系列都为网上资源整理而来,如有问题,及时联系。
JVM的位置
- JVM在操作系统之上,直接与操作系统进行交互
JVM的体系结构
类加载器
- 作用:加载Class文件
- new关键字:new一个对象,引用在栈里面,具体的实例在堆里面
- getClass():返回class模板
- getClassLoader():返回类加载器
- 种类:
- 虚拟机自带的加载器
- 启动类(根)加载器
- 扩展类加载器
- 应用程序(系统类)加载器
- JDK自带有三个类加载器:Bootstrap ClassLoader、ExtClassLoader、AppClassLoader。
- BootStrapClassLoader是ExtClassLoader的父类加载器,默认负责加载%JAVA_HOME%lib下的jar包和 class文件。
- ExtClassLoader是AppClassLoader的父类加载器,负责加载%JAVA_HOME%/lib/ext文件夹下的jar包和 class类。
- AppClassLoader是自定义类加载器的父类,负责加载classpath下的类文件。系统类加载器,线程上下文加载器继承ClassLoader实现自定义类加载器
双亲委派机制
-
流程
- 类加载器收到类加载请求
- 将这个请求向上委托给父类加载器去完成,一直向上委托,直到启动类加载器
- 启动加载器检查是否能够加载当前这个类,能加载就结束,否则,抛出异常,通知子类加载器进行加载
- 重复上一步
- 自己理解:双亲委派机制,就是先由小到大判断该类是否已经加载,已加载就不必加载,没有加载按照由大到小的顺序判断是否可以加载,自己可以加载就自己加载,自己不能加载就交给小的加载,直到应用程序加载器,如果此时还不能加载,抛出异常。
-
-
沙箱安全机制
- Java安全模型的核心就是Java沙箱。沙箱机制就是讲Java代码限定在虚拟机JVM特定的运行范围中,并且严格限制代码对本地资源的访问,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。
- 沙箱主要限制系统资源访问,例如:CPU、内存、文件系统、网络。
- 组成沙箱的基本组件:
- 字节码校验器(bytecode verifier):确保Java类文件遵循Java语言规范。可以帮助Java程序实现内存保护。核心类不经过字节码校验
- 类装载器:其中类装载器在3个方面对Java沙箱起作用
- 防止恶意代码干涉善意代码(双亲委派机制)
- 守护被信任的类库边界
- 它将代码归入保护域,确定了代码可以进行哪些操作
- 类装载器采用的机制是双亲委派机制:
- 从最内层JVM自带的类加载器开始加载,外层恶意同名类得不到加载从而无法调用
- 由于严格通过包来区分了访问域,外层恶意的类通过内置代码也无法获得权限访问到内部类,破坏代码就自然无法生效
- 存取控制器(access controller):存取控制器可以控制核心API对操作系统的存取权限,而这个控制的策略设定可以由用户指定。
- 安全管理器(security manager):是核心API和操作系统之间的主要接口。实现权限控制,比存取控制器优先级高
- 安全软件包(security package):java.security下的类和扩展包下的类,允许用户为自己的应用增加新的安全特性,包括:
- 安全提供者
- 消息摘要
- 数字签名
- 加密
- 鉴别
PC寄存器
- 程序计数器:Program Counter Register
- 每个线程都有一个程序计数器,是线程私有的,就是一个指针,指向方法区中的字节码(用来存储指向一条指令的地址,也即将要执行的指令代码),在执行引擎读取下一条指令,是一个非常小的内存空间,几乎可以忽略不计
native、方法区(在堆里面的持久代)
- native:凡是带了native关键字的,说明Java的作用范围达不到了,需要调用底层c语言库。会进入本地方法栈,调用本地接口JNI(JNI是为了扩展Java使用,融合不同的编程语言为Java使用)。
- 方法区:方法区是被所有线程共享的,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义,简单来说,所有定义的方法的信息都保存在该区域,此区域属于共享区域
- 静态变量(static),常量(final),类信息(Class)(构造方法、接口定义)、运行时的常量池存在方法区中,但是实例变量存在堆内存,和方法区无关
栈(先进后出)
- 栈内存,主管程序的运行,生命周期和线程同步。线程结束,栈内存就释放,对于栈来说,不存在垃圾回收问题。
- 主要存储:八大基本类型+对象引用+实例的方法
- 栈运行原理:栈帧
三种JVM
- Sun–>HotSpot
- BEA–>JRockit
- IBM -->J9VM
堆
- 一个JVM只有一个堆内存,堆内存的大小是可以调节的
类加载器读取了类文件后,一般会把什么东西放到堆?
- 类、方法、常量、变量,保存我们所有引用类型的真实对象
堆内存中的三个区域
- 新生区(Young)(占1/3):一个类诞生、成长甚至死亡的地方
- 伊甸园(Eden Space)
- 幸存区(伊甸园和老年区之间的过渡)
- from区(两者之间交换,谁空谁是to区)
- to区(两者之间交换)
- 老年区(old)(占2/3):新生区没有被GC回收的(当一个对象经历了15次GC,会进入老年区)
- 永久区(Perm):这个区域常驻内存。用来存放JDK自身携带的Class对象。interface元数据,存储的是Java运行时的一些环境或类信息,这个区域不存在垃圾回收!关闭VM虚拟就会释放这个区域的内存。逻辑上存在,物理上不存在(新生区+老年区=堆内存)
- jdk1.6之前:永久代,常量池在方法区
- jdk1.7:永久代,但是慢慢退化了,去永久代,常量池在堆中
- jdk8以后,永久区改名元空间
堆内存调优
- 堆内存溢出OOM
- 调大堆内存空间
- 能够看到第几行代码出错
- 内存快照分析工具MAT、Jprofile
- 分析Dump内存文件
- 获得堆中的数据
- 获得大的对象
- 内存快照分析工具MAT、Jprofile
- Dubug,一行行代码分析
- -Xms 设置初始化内存分配大小 1/64
- -Xmx 设置最大分配内存;默认1/4
- -XX:+PrintGCDetails 打印GC垃圾回收信息
- -XX:+HeapDumponOutOfMemoryError Dump文件
GC
- GC垃圾回收,主要在伊甸园区和养老区(主要在堆)
- GC两种类型
- 轻GC(普通GC):主要在新生区
- 重GC(重GC)
- GC算法
- 标记清除法(优化了复制算法)
- 使用场景:老年代(标记清除法+标记压缩)
- 概念:
- 标记:扫描对象,对活着的对象进行标记
- 清除:对没有标记的对象进行清除
- 优点:不需要额外的空间
- 缺点:两次扫描严重浪费时间,会产生内存碎片
- 标记压缩(优化了标记清除法)
- 使用场景:老年代(标记清除法+标记压缩)
- 防止内存碎片的产生
- 缺点:多了移动成本
- 复制算法
- 将内存划分为两个区间,在任意时间点,所有动态分配的对象都只能分配在其中一个区间(称为活动区间),而另外一个区间(称为空闲区间)则是空闲的,空间满了之后进行GC
- 最佳使用场景:对象存活度较低(新生区)
- 好处:没有内存碎片
- 坏处:浪费了内存空间,多一半的空间永远是to
- 引用计数器:每个对象有一个引用计数属性,新增一个引用时计数加1,引用释放时计数减1,计数为0时可以回收
- 总结:
- 内存效率:复制算法>标记清除算法>标记压缩算法
- 内存整齐度:复制算法=标记压缩算法>标记清除算法
- 内存利用率:标记压缩算法=标记清除算法>复制算法
- 标记清除法(优化了复制算法)
JMM:Java Memory Model
- 什么是JMM
- JMM(Java Memory Model的缩写)允许编译器和缓存以数据在处理器特定的缓存(或寄存器)和主存之间移动的次序拥有重要的特权,除非程序员使用了volatile或synchronized明确请求了某些可见性的保证。
- JMM是干什么的
- 作用:缓存一致性协议,用于定义数据读写的规则
- JMM定义了线程和主内存之间的抽象关系:线程之间的共享变量储存在主内存中,每个线程都有一个私有的本地内存
- 解决共享对象可见性问题:volilate
- 如何学习JMM
- 官方、博客、视频
- JMM:抽象的概念和理论
- 不允许read和load、store和write操作之一单独出现。即使用了read必须load,使用了store必须write
- 不允许线程丢弃他最近的assign操作,即工作变量的数据改变了之后,必须告知主存
- 不允许一个线程将没有assign的数据从工作内存同步回主内存
- 一个新的变量必须在主内存中诞生,不允许工作内存直接使用一个未被初始化的变量。就是怼变量实施use、store操作之前,必须经过assign和load操作
- 一个变量同一时间只有一个线程能对其进行lock。多次lock后,必须执行相同次数的unlock才能解锁
- 如果对一个变量进行lock操作,会清空所有工作内存中此变量的值,在执行引擎使用这个变量前,必须重新load或assign操作初始化变量的值
- 如果一个变量没有被lock,就不能对其进行unlock操作。也不能unlock一个被其他线程锁住的变量
- 对一个变量进行unlock操作之前,必须把此变量同步回主内存
GC的面试题
GC 是什么? 为什么要有 GC?
- GC 是垃圾收集的意思(Gabage Collection),内存处理是编程人员容易出现问题的地方,忘记或者错误的内存回收会导致程序或系统的不稳定甚至崩溃。
- Java 提供的 GC 功能可以自动监测对象是否超过作用域从而达到自动回收内存的目的,Java 语言没有提供释放已分配内存的显示操作方法。
- Java 程序员不用担心内存管理,因为垃圾收集器会自动进行管理。要请求垃圾收集,可以调用下面的方法之一:System.gc() 或 Runtime.getRuntime().gc() 。
GC如何判断对象可以被回收
- 引用计数法:每个对象有一个引用计数属性,新增一个引用时计数加1,引用释放时计数减1,计数为0时可以回收
- 可达性分析法:从 GC Roots 开始向下搜索,搜索所走过的路径称为引用链。当一个对象到 GC Roots 没有任何引用链相连时,则证明此对象是不可用的,那么虚拟机就判断是可回收对象。
垃圾回收的优点和原理。并考虑 2 种回收机制
- 由于有个垃圾回收机制,Java 中的对象不再有“作用域”的概念,只有对象的引用才有“作用域”。
- 垃圾回收可以有效的防止内存泄露,有效的使用可以使用的内存。垃圾回收器通常是作为一个单独的低级别的线程运行,不可预知的情况下对内存堆中已经死亡的或者长时间没有使用的对象进行清楚和回收,程序员不能实时的调用垃圾回收器对某个对象或所有对象进行垃圾回收。
- 回收机制又分代复制垃圾回收和标记垃圾回收,增量垃圾回收。
垃圾回收器的基本原理是什么?垃圾回收器可以马上回收内存吗?有什么办法主动通知虚拟机进行垃圾回收?
- 对于 GC 来说,当程序员创建对象时,GC 就开始监控这个对象的地址、大小 以及使用情况。通常,GC 采用有向图的方式记录和管理堆(heap)中的所有对象。 通过这种方式确定哪些对象是"可达的",哪些对象是"不可达的"。当 GC 确定一 些对象为"不可达"时,GC 就有责任回收这些内存空间。
- 可以。
- 程序员可以手动 执行 System.gc(),通知 GC 运行,但是 Java 语言规范并不保证 GC 一定会执行。