1、对象创建
- 1、类加载检查
当JVM检测到有一条new指令时,首先先检查该指令的参数是否在常量池中定位到一个类的符号引用,并检查这个符号引用所代表的类是否已被加载、解析和初始化过。如果存在的话,JVM将直接使用已有的信息对该类进行操作。
- 2、虚拟机为新生对象分配内容
在类加载检査通过后,接下来虚拟机将为新生对象分配内存。对象所需内存的大小在类加载完成后便可完全确定,为对象分配空间的任务等同于把一块确定大小的内存从Java堆中划分出来。
选择哪种分配方式由所采用的垃圾收集器是否带有压缩整理功能来决定内存的分配方式:
1.指针碰撞:
假设Java堆中内存是绝对规整的,所有用过的内存都放在一边,空闲的内存放在另一边,中间放着一个指针作为分界点的指示器,那所 分配内存就仅仅是把那个指针向空闲空间那边挪动一段与对象大小相等的距离。在使用Serial、ParNew等带Compact过程的收集器时,系统采用的分配算法是指针碰撞
2.空闲列表:
如果Java堆中的内存并不是规整的,已使用的内存和空闲的内存相互交错,那就没有办法简单地进行指针碰撞丁,虚拟机就必须维护一个列 表,记录上哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录。在使用CMS这种基于Mark-Sweep算法的收集器时,通常采用空闲列表。
分配内存的时候有一个new对象时的线程安全性,也就是内存分配时的同步问题:可能出现正在给对象A分配内存,指针还没来得及修改,对象B又同时使用了原来的指针来分配内存的情况,有两种解决这个问题的方案:
a、 一种是对分配内存空间的动作进行同步处理---实际上虚拟机采用CAS配上失败重试的方式保证更新操作的原子性;
b、一种是把内存分配的动作按照线程划分在不同的空间之中进行, 即每个线程在Java堆中预先分配一小块内存,称为本地线程分配缓冲(TLAB)。TLAB在哪个线程要分配内存,就在哪个线程的TLAB上分配,只有TLAB用完并分配新的TLAB时,才需要同步锁定、虚 拟机是否使用TLAB,可以通过-XX:+AUseTLAB参数来设定。
- 3、内存分配结束。
内存分配结束,虚拟机将分配到的内存空间都初始化为零值(不包括对象头)。这一步保证了对象的实例字段在Java代码中可以不用赋初始值就可以直接使用,程序能访问到这些字段的数据类型所对应的零值。
- 4、对对象进行必要的设置。
对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。这些信息存放在对象的对象头之中。
- 5、初始化对象(执行<init>方法)。
当完成上述操作后,对象的内存便分配成功了,但是所有的字段都还是零。
此时应该执行<init>方法,把对象按照程序员的意愿进行初始化,从而产生一个真正可用的对象。
2、对象的内存布局
对象在内存中存储的布局大约有三块区域:对象头(Header)、实例数据(Instance Data)和对齐补充(Padding)。
- 1、对象头
HotSpot虚拟机的对象头包括两部分信息:
非固定的数据结构。一来是用来存储对象自身的运行时数据,如哈希码、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等。二来是类型指针,即对象指向它的类元数据的指针、JVM通过这个指针来确定这个对象是哪个类的实例。如果对象是一个Java数组,则在对象头中还需要有一块记录数组长度数据。
- 2、实例数据
存储对象真正有效的信息,也就是程序代码中所定义的各种类型的字段内容。不论是从父类继承下来的,还是在子类中定义的。这部分的存储顺序会受到Java源码中定义顺序的影响。默认的分配策略:long/double,int,shorts/char,bytes/boolean,oop,相同宽度的字段会被分配到一起。
- 3、对齐填充
不一定必须存在。启到占位符的作用。因为JVM的自动内存管理系统要求对象的起始地址必须是8字节的整数倍,即对象的大小必须是8字节的整数倍。故当对象实例数据部分没有对齐时,就需要通过对齐填充来补全。
3、对象的访问定位
建立对象是为了使用对象,Java程序需要通过栈上的reference(引用)数据来操作堆上的具体对象。对象访问会涉及到Java栈、Java堆、方法区这三个内存区域。
Object obj = new Object();
上面对象实例化的其实有两部分内容,一部分是类数据(比如代表类的Class对象)、一部分是实例数据
假如这句代码出现在方法体中,"Object obj" 这部分会作为引用类型(reference)的数据保存在Java栈的本地变量表中。而"new Object()"这部分实例化对象将会反映到Java堆中,形成一块存储Object实例化对象的所有实例数据值的结构化内存,根据具体数据类型以及虚拟机实现的对象内存布局的不同,这块内存的长度是不固定的。另外,在Java堆中还必须包含能查到此对象类型数据(如对象类型、父类、实现的接口、方法等)的地址信息,这些数据类型则存储在方法区中。
由于reference类型在java虚拟机规范里面只规定了一个指向对象的引用地址,并没有定义这个引用应该通过哪种方式去定位,访问到java堆中的对象位置,因此不同的虚拟机实现的访问方式可能不同,主流的方式有两种:使用句柄和直接指针:
1、使用句柄访问,Java堆中将会划分出一块内存来作为句柄池,obj(reference引用)中存储的是对象的句柄地址,而句柄中包含了类数据的地址和对象实例数据的地址。
2、直接指针访问,Java堆中也就是对象中存储所有的实例数据和类数据的地址,此时obj(reference引用)存放的是对象地址。
两种访问方式的对比:
a、使用句柄时,如果对象被移动时,只会改变句柄中的实例数据指针,reference本身不需要被修改。
b、使用直接指针访问最大的好处在于速度较快,因为其节省了一次指针定位的时间开销。
目前使用直接指针访问的方式比较常用,HotSpot虚拟机采用的是后者,因为对象的访问在Java程序运行过程中是比较频繁的,积少成多也会造成太多的时间开销。不过前者的对象访问方式也是十分常见的。