在构造函数内对一个 final 域的写入,与随后把这个被构造对象的引用赋值给一个引用变量,这两个操作之间不能重排序。
即:禁止把 final 域的写入操作重排序到构造函数之外。
这个规则的实现包含下面 2 个方面。
1、JMM 禁止编译器 把 final 域的写入操作重排序到构造函数之外。
2、编译器会在 final 域的写入操作之后,构造函数 return 之前,插入一个 StoreStore 屏障。
这个 屏障禁止处理器 把 final 域的写入操作重排序到构造函数之外。
2、读 final 域的重排规则
在一个线程中,初次读一个包含 final 域的对象的引用,与随后初次读这个 final 域,这两个操作之间不能重排序。
这个规则的实现包含下面 1 个方面。
编译器会在 读 final 域操作之前,插入一个 LoadLoad 屏障。
这个 屏障禁止处理器重排序这两个操作。
注意:这个规则仅仅针对 处理器 。
初次读包含 final 域的对象的引用与随后初次读这个 final 域,两个操作间存在间接依赖关系。
由于 编译器 遵守 间接依赖关系。因此,编译器不会重排序这两个操作。
有少数处理器允许对存在间接依赖关系的操作做重排序,这个规则是专门针对这种处理器的。
如:alpha 处理器。
假设线程 A 在执行 writer() 方法,线程 B 执行 reader() 方法。
publicclassFinalDemo{privateint a;// 普通域privatefinalint b;// final域privatestaticFinalDemo obj;publicFinalDemo(){
a =1;// 可以被指令重排序到 StoreStore 后边。
b =2;// StoreStore}publicstaticvoidwriter(){
obj =newFinalDemo();}publicstaticvoidreader(){FinalDemo object = obj;int a = object.a;// 可以被指令重排序到 LoadLoad 后边。int b = object.b;// LoadLoad}}
3、写 final 域 对 引用类型 的 扩展约束
对于引用类型,写 final 域的重排序规则对 编译器 和 处理器增加了如下约束:
在构造函数内对一个 final 引用的对象的成员域的写入,与随后在构造函数外把这个被构造对象的引用赋值给一个引用变量,这两个操作之间不能重排序。
这个约束的目的:
避免在构造函数中,由于指令重排序,导致 obj 被赋值一个 半初始化对象。
从而避免其它线程在 reader() 方法中 得到的 i 的值为 0 ;
这个约束的实现: volatile 关键字。
publicclassFinalReferenceEscapeExample{privatefinalint i;// 解决方案:在声明 FinalReferenceEscapeExample obj; 前边添加上 volatile 。// 防止在构造函数中,由于指令重排序,导致 obj 被赋值一个 半初始化对象。// 避免 reader() 方法中 得到的 i 的值为 0 ;privateFinalReferenceEscapeExample obj;publicFinalReferenceEscapeExample(){
i =1;// 1 写 final 域
obj =this;// 2 this 引用在此"逸出"}publicstaticvoidreader(){if(obj !=null){// 3int temp = obj.i;// 4}}}
二、final 域为 基本类型
示例代码:
假设线程 A 在执行 writer() 方法,线程 B 执行 reader() 方法。
publicclassFinalDemo{privateint a;// 普通域privatefinalint b;// final域privatestaticFinalDemo obj;publicFinalDemo(){
a =1;// 1.写普通域
b =2;// 2.写 final 域}publicstaticvoidwriter(){
obj =newFinalDemo();}publicstaticvoidreader(){FinalDemo object = obj;// 3.读对象引用int a = object.a;// 4.读普通域int b = object.b;// 5.读 final 域}}
1、写 final 域的重排规则
写 final 域的重排序规则可以确保:
在对象引用为任意线程可见之前,对象的 final 域已经被正确初始化过了。
而普通域不具有这个保障。
writer 方法,虽然只有一行代码,但实际上做了两件事情:
1、构造一个 FinalExample 类型的对象。
2、把这个对象的引用赋值给引用变量 obj。
假设,线程 B 读对象引用与读对象的成员域之间没有重排序,下图是一种可能的执行时序。
写普通域 的操作被编译器重排序到了构造函数之外。
因此,读线程 B 错误地读取了普通变量 i 初始化之前的值。
写 final 域 的操作,被写 final 域的重排序规则“限定”在了构造函数之内。
读线程 B 正确地读取了 final 变量初始化之后的值。
2、读 final 域的重排规则
读 final 域的重排序规则可以确保:
在读一个对象的 final 域之前,一定会先读包含这个 final 域的对象的引用。
reader 方法,包含 3 个操作:
1、初次读引用变量 obj。
2、初次读引用变量 obj 指向对象的普通域 j 。
3、初次读引用变量 obj 指向对象的 final 域 i 。
假设,写线程 A没有发生任何重排序,同时程序在不遵守间接依赖的处理器上执行.
下图是一种可能的执行时序。
读对象的普通域的操作被处理器重排序到读对象引用之前。
读普通域时,该域还没有被写线程 A 写入,这是一个错误的读取操作。
而读 final 域的重排序规则会把读对象 final 域的操作“限定”在读对象引用之后。
此时,该 final 域已经被 A 线程初始化过了,这是一个正确的读取操作。
三、写 final 域 对 引用类型 的 扩展约束
1、扩展约束的原因
示例代码:
publicclassFinalReferenceDemo{finalint[] intArray;// final 是引用类型privateFinalReferenceDemo obj;publicFinalReferenceDemo(){// 构造函数
intArray =newint[1];// 1
intArray[0]=1;// 2}publicvoidwriterOne(){// 写线程 A 执行
obj =newFinalReferenceDemo();// 3}publicvoidwriterTwo(){// 写线程 B 执行
intArray[0]=2;// 4}publicvoidreader(){// 读线程 C 执行if(obj !=null){// 5int temp = obj.intArray[0];// 6}}}
假设,首先线程 A 执行 writerOne() 方法。
* 线程 A 执行完后,线程 B 执行 writerTwo() 方法。
* 线程 B 执行完后,线程 C 执行 reader() 方法。
下图是一种可能的线程执行时序。
规则的分析:
1 是对 final 域的写入。
2 是对这个 final 域引用的对象的成员域的写入。
3 是把被构造的对象的引用赋值给某个引用变量。
这里除了前面提到的 1 和 3 也不能重排序, 2 和 3 也不能重排序。
JMM 可以确保读线程 C 至少能看到写线程 A 在构造函数中对 final 引用对象的成员域的写入。
* 即:线程 C 至少能看到数组下标 0 的值为 1。
然而,写线程 B 对数组元素的写入,读线程 C 可能看得到,也可能看不到。
JMM 不保证线程 B 的写入对读线程 C 可见。因为,写线程 B 和读线程 C 之间存在数据竞争。
* 此时,的执行结果不可预知。
如果想要确保读线程 C 看到写线程 B 对数组元素的写入。
写线程 B 和读线程 C 之间需要使用 同步原语(lock 或 volatile)来确保 内存 可见性。
2、为什么 final 域所在对象的对象引用不能从构造函数内“溢出”
写 final 域的重排序规则可以确保:
在对象引用为任意线程可见之前,对象的 final 域已经被正确初始化过了。
其实,要得到这个效果,还需要一个保证:
在构造函数内部,不能让这个被构造对象的引用被其它线程所见。
即:被构造对象的引用不能在构造函数中“逸出”。
代码示例:
publicclassFinalReferenceEscapeExample{privatefinalint i;// 解决方案:在声明 FinalReferenceEscapeExample obj; 前边添加上 volatile 。// 防止在构造函数中,由于指令重排序,导致 obj 被赋值一个 半初始化对象。// 避免 reader() 方法中 得到的 i 的值为 0 ;privateFinalReferenceEscapeExample obj;publicFinalReferenceEscapeExample(){
i =1;// 1 写 final 域
obj =this;// 2 this 引用在此"逸出"}publicstaticvoidreader(){if(obj !=null){// 3int temp = obj.i;// 4}}}
假设一个线程 A 执行 writer() 方法,另一个线程 B 执行 reader() 方法。
这里的操作 2 使得对象还未完成构造前就为线程 B 可见。
即使这里的操作 2 是构造函数的最后一步,且在程序中操作 2 排在操作 1 后面。
执行 read() 方法的线程仍然可能无法看到final 域被初始化后的值。
因为,这里的操作 1 和操作 2 之间可能被重排序。
在构造函数返回前,被构造对象的引用不能被其它线程所见。
因为,此时的 final 域可能还没有被初始化。
在构造函数返回后,任意线程都将保证能看到 final 域正确初始化之后的值。
四、final 语义在处理器中的实现
以 X86 处理器为例,说明 final 语义在处理器中的具体实现。
写 final 域的重排序规则会要求编译器在 final 域的写之后,构造函数 return之前插入一个StoreStore 障屏。
读 final 域的重排序规则要求编译器在读 final 域的操作前面插入一个 LoadLoad 屏障。
由于 X86 处理器不会对写-写操作做重排序。
所以,在 X86 处理器中,写 final 域需要的 StoreStore 障屏会被省略掉。
同样,由于 X86 处理器不会对存在间接依赖关系的操作做重排序。
所以,在 X86 处理器中,读 final 域需要的 LoadLoad 屏障也会被省略掉。
也就是说,在 X86 处理器中,final 域的读/写不会插入任何 内存屏障!
五、JSR-133 为什么要增强 final 的语义
在旧的 Java 内存模型中,一个最严重的缺陷就是线程可能看到 final 域的值会改变。
如:一个线程当前看到一个整型 final 域的值为 0(还未初始化之前的默认值)。
过一段时间之后这个线程再去读这个 final 域的值时,却发现值变为1(被某个线程初始化之后的值)。
最常见的例子就是在旧的 Java 内存模型中,String 的值可能会改变。
为了修补这个漏洞,JSR-133 专家组增强了 final 的语义。
通过为 final 域增加写和读重排序规则,可以为 Java 程序员提供初始化安全保证:
只要对象是正确构造的(被构造对象的引用在构造函数中没有“逸出”)。
那么,不需要使用同步(指 lock 和 volatile 的使用)就可以保证任意线程都能看到这个 final 域在构造函数中被初始化之后的值。