JVM
1. JVM的位置(JRE包含了JVM)
在操作系统(Windows、Linux、Mac)之上,程序在JVM上运行
2. JVM体系结构
3. 类加载器
作用:加载class文件
- 虚拟机自带的加载器
- 启动类(根)加载器
- 扩展类加载器
- 应用程序(系统类)加载器
4. 双亲委派机制
作用:为了保证安全,APP–>EXC–>BOOT(最终执行)
双亲委派机制过程
- 类加载器收到类加载的请求
- 将这个请求向上委托给父类加载器去完成,一直向上委托,直到启动加载类
- 启动加载器检查是否能过加载当前这个类,能加载就结束,使用当前的加载器,否则抛出异常,通知子加载器进行加载
- 重复步骤3
5. 沙箱安全机制(了解即可)
什么是沙箱?
Java安全模型的核心就是Java沙箱(sandbox),什么是沙箱?沙箱是一个限制程序运行的环境。沙箱机制就是将 Java 代码限定在虚拟机(JVM)特定的运行范围中,并且严格限制代码对本地系统资源访问,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。沙箱==主要限制系统资源访问==,那系统资源包括什么?——CPU、内存、文件系统、网络
。不同级别的沙箱对这些资源访问的限制也可以不一样。
所有的Java程序运行都可以指定沙箱,可以定制安全策略。
java中的安全模型:
在Java中将执行程序分成本地代码和远程代码两种,本地代码默认视为可信任的,而远程代码则被看作是不受信的。对于授信的本地代码,可以访问一切本地资源。而对于非授信的远程代码在早期的Java实现中,安全依赖于沙箱 (Sandbox) 机制。如下图所示 JDK1.0安全模型
但如此严格的安全机制也给程序的功能扩展带来障碍,比如当用户希望远程代码访问本地系统的文件时候,就无法实现。因此在后续的 Java1.1 版本中,针对安全机制做了改进,增加了安全策略
,允许用户指定代码对本地资源的访问权限。如下图所示 JDK1.1安全模型
在 Java1.2 版本中,再次改进了安全机制,增加了代码签名
。不论本地代码或是远程代码,都会按照用户的安全策略设定,由类加载器加载到虚拟机中权限不同的运行空间,来实现差异化的代码执行权限控制。如下图所示 JDK1.2安全模型
当前最新的安全机制实现,则引入了域 (Domain) 的概念。虚拟机会把所有代码加载到不同的系统域和应用域,系统域部分专门负责与关键资源进行交互,而各个应用域部分则通过系统域的部分代理来对各种需要的资源进行访问。虚拟机中不同的受保护域 (Protected Domain),对应不一样的权限 (Permission)。存在于不同域中的类文件就具有了当前域的全部权限,如下图所示 最新的安全模型(jdk 1.6)
以上提到的都是基本的Java 安全模型概念
,在应用开发中还有一些关于安全的复杂用法
,其中最常用到的 API 就是 doPrivileged。doPrivileged 方法能够使一段受信任代码获得更大的权限,甚至比调用它的应用程序还要多,可做到临时访问更多的资源
。有时候这是非常必要的,可以应付一些特殊的应用场景。例如,应用程序可能无法直接访问某些系统资源,但这样的应用程序必须得到这些资源才能够完成功能。
组成沙箱的基本组件:
字节码校验器
(bytecode verifier):确保Java类文件遵循Java语言规范。这样可以帮助Java程序实现内存保护。但并不是所有的类文件都会经过字节码校验,比如核心类。类装载器
(class loader):其中类装载器在3个方面对Java沙箱起作用- 它防止恶意代码去干涉善意的代码;
- 它守护了被信任的类库边界;
- 它将代码归入保护域,确定了代码可以进行哪些操作。
虚拟机为不同的类加载器载入的类提供不同的命名空间,命名空间由一系列唯一的名称组成,每一个被装载的类将有一个名字,这个命名空间是由Java虚拟机为每一个类装载器维护的,它们互相之间甚至不可见。
类装载器采用的机制是双亲委派模式。
- 从最内层JVM自带类加载器开始加载,外层恶意同名类得不到加载从而无法使用;
- 由于严格通过包来区分了访问域,外层恶意的类通过内置代码也无法获得权限访问到内层类,破坏代码就自然无法生效。
存取控制器
(access controller):存取控制器可以控制核心API对操作系统的存取权限,而这个控制的策略设定,可以由用户指定。安全管理器
(security manager):是核心API和操作系统之间的主要接口。实现权限控制,比存取控制器优先级高。安全软件包
(security package):java.security下的类和扩展包下的类,允许用户为自己的应用增加新的安全特性,包括:- 安全提供者
- 消息摘要
- 数字签名
- 加密
- 鉴别
6. Native
native:凡是带了native关键字的,说明java的作用范围达不到了,会去调用底层C语言的库。会进入本地方法栈,调用本地方法本地接口(JNI)
JNI:Java Native Interface
JNI作用:扩展Java的使用,融合不同的编程语言为Java所用,最初为了融合C、C++,在内存区域中专门开辟了一块标记区域:Native Method Stack,用来登记native方法,在最终执行的时候,加载本地方法库中的方法通过JNI
7. 程序计数器
每个线程逗游一个程序计数器,是线程私有的,就是一个指针
在执行引擎读取下一条指令,是一个非常小的内存空间,几乎可以忽略不计
8. 方法区
Method Area方法区
方法区被所有线程共享,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义,简单的说,所有定义的方法的信息都保存在该区域,此区域属于共享区间
静态变量、常量、类信息(构造方法、接口定义)、运行时的常量池存在方法区中,但是实例变量存在堆内存中,和方法区无关
static、final、Class、常量池
9. 栈Stack
栈:先进后出
队列:先进先出
栈:栈内存,生命周期和线程同步,线程结束,栈内存也就释放了,对于栈来说,不存在垃圾回收问题,一旦线程结束,栈就结束
栈:8大基本类型 + 对象引用 + 实例的方法
基本类型:Boolean、int、char、float、long、double、byte、short
栈运行原理:栈帧
栈 + 堆 + 方法区:交互关系
三种JVM
- Sun公司 HotSpot
Java HotSpot(TM) 64-Bit Server VM 18.9 (build 11.0.4+10-LTS, mixed mode)
- BEA JRockit
- IBM j9vm
10. 堆Heap
一个JVM只有一个堆内存,堆内存的大小是可以调节的
类加载器读取类文件后,一般把什么放在堆中?类、方法、常量、变量,保存所有引用类型的真实对象
堆内存中还要细分为三个区域:
- 新生区young/new
- 养老区old
- 永久区perm
GC垃圾回收,主要在伊甸园区和养老区
假设内存满了,OOM,堆内存不够 java.lang.OutOfMemoryError:Java heap space
11. 新生区-养老区-永久区
新生区分为
- 伊甸园区:所有对象都在伊甸园区new出来
- 幸存者区(0区、1区)
养老区
99%对象都是临时对象
永久区
这个区域常驻内存,用来存放JDK自身携带的Class对象,Interface元数据,存储的是Java运行时的一些环境或类信息,这个区域不存在垃圾回收,关闭VM虚拟就会释放这个区域的内存
一个启动类加载了大量的第三方jar包,Tomcat部署了太多的应用,,大量动态生成的反射类。不断的被加载,直到内存满,就会出现OOM
元空间:逻辑上存在,物理上不存在
12. GC垃圾回收
JVM在进行GC时,并不是对这三个区域统一回收。大部分时候,回收都是新生代
- 新生代
- 幸存区
- 老年区
GC两种类:轻GC(普通GC)、重GC(全局GC)
GC题目
- JVM的内存模型和分区,详细到每个区放什么
- 堆里面的分区有哪些?Eden、from、to、老年区,说说他们的特点
- GC的算法有哪些?标记清除法、标记压缩、复制算法、引用计数器,怎么用的
- 轻GC和重GC分别在什么时候发生
13. 引用计数器
14. 复制算法
- 优点:没有内存碎片
- 缺点:浪费内存空间,多一半空间永远是空的
复制算法适合对象存活率较低的情况(新生区)
15. 标记清除法
- 优点:不需要额外的空间
- 缺点:两次扫描,严重浪费时间,会产生内存碎片
16. 标记压缩法
标记清除压缩:先标记清除几次,再进行压缩
总结
内存效率:复制算法 > 标记清除算法 > 标记压缩算法(时间复杂度)
内存整齐度:复制算法 = 标记压缩算法 > 标记清除算法
内存利用率:标记压缩算法 = 标记清除算法 > 复制算法
没有最优的算法,只有最合适的算法 ----> GC:分代收集算法
年轻代:存活率低,复制算法
老年代:区域大,存活率高,标记清除+标记压缩 混合实现
9)]
标记清除压缩:先标记清除几次,再进行压缩