深入理解Java虚拟机笔记(八)Java内存模型与线程

最新推荐文章于 2023-07-20 10:13:07 发布

原创最新推荐文章于 2023-07-20 10:13:07 发布 · 593 阅读

0 ·

CC 4.0 BY-SA版权

Java虚拟机专栏收录该内容

10 篇文章

订阅专栏

本文围绕Java内存模型与多线程展开。介绍了硬件效率与一致性问题及缓存一致性协议，阐述Java内存模型，包括主内存与工作内存交互操作、volatile变量规则等。还讲述了Java多线程的实现方式、调度方法及线程状态转换，如内核线程、用户线程实现等。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

概述

多任务处理在现代计算机操作系统中几乎已是一项必备的功能了。在许多情况下，让计算机同时去做几件事情，不仅是因为计算机的运算能力强大了，还有一个很重要的原因是计算机的运算速度与它的存储和通信子系统速度的差距太大，大量的时间都花费在磁盘I/O、网络通信或者数据库访问上。如果不希望处理器在大部分时间里都处于等待其他资源的状态，就必须使用一些手段去把处理器的运算能力“压榨”出来，否则就会造成很大的浪费，而让计算机同时处理几项任务则是最容易想到、也被证明是非常有效的“压榨”手段。

硬件的效率与一致性

由于计算机的存储设备与处理器的运算速度有几个数量级的差距，所以现代计算机系统都不得不加入一层读写速度尽可能接近处理器运算速度的高速缓存（Cache）来作为内存与处理器之间的缓冲：将运算需要使用到的数据复制到缓存中，让运算能快速进行，当运算结束后再从缓存同步回内存之中，这样处理器就无须等待缓慢的内存读写了。

引入基于高速缓存的存储交互也带来了新的问题:缓存一致性。每个处理器都有自己的高速缓存，而它们又共享同一块主内存，当多个处理器的运算任务都设计同一块主内存区域时，可能会导致各自的缓存书数据不一致。解决一致性问题:缓存一致性协议。

"内存模型":在特定的操作协议下，对特定的内存或高速缓存进行读写访问的过程抽象。Java虚拟机也有自己的内存模型。

[外链图片转存失败(img-CEr1Ot9e-1562727325389)(/1562636160750.png)]

除了增加高速缓存之外，为了使得处理器内部的运算单元能尽量被充分利用，处理器可
能会对输入代码进行乱序执行优化，处理器会在计算之后将乱序执行的结果重组，保证该结果与顺序执行的结果是一致的，但并不保证程序中各个语句计算的先后顺序与输入代码中的顺序一致。

Java内存模型

Java虚拟机规范中试图定义一种Java内存模型（Java Memory Model,JMM）来屏蔽掉各种硬件和操作系统的内存访问差异，以实现让Java程序在各种平台下都能达到一致的内存访问效果。

主内存与工作内存

Java模型的主要目标是定义程序中各个变量的访问规则。

变量包括实例字段，静态字段和构成数组对象的元素，但不包括局部变量的方法参数。因为方法参数是线程私有的，不会被共享。(局部变量若是reference，对象在堆中，但reference本身是存在与方法栈中的)

Java内存模型规定了所有的变量都存储在主内存中。每条线程都有自己的工作内存，工作内存是主内存的副本拷贝，线程对变量的操作是对自己的工作内存进行操作，然后再同步到主内存里面。不能直接对主内存进行操作。

[外链图片转存失败(img-JSkFHmK0-1562727325391)(/1562637937312.png)]

主内存主要对应Java堆中的对象实例，工作内存主要对应虚拟机栈的部分区域。

从底层次上说，主内存直接对应物理内存，工作内存对应高速缓存器或者寄存器。

内存间的交互操作

Java内存模型中定义了以下8种操作来完成:

lock：作用于主内存的变量，它把一个变量标识为一条线程独占的状态。
unlock：作用于主内存的变量，它把一个处于锁定状态的变量释放出来，释放后的变量才可以被其他线程锁定。
read：作用于主内存的变量，它把一个变量的值从主内存传输到线程的工作内存中，以便随后的load动作使用。
load:作用于工作内存的变量，它把read操作从主内存中得到的变量值放入工作内存的变量副本中。
use：作用于工作内存的变量，它把工作内存中一个变量的值传递给执行引擎，每当虚拟机遇到一个需要使用到变量的值的字节码指令时将会执行这个操作。
assign：作用于工作内存的变量，它把一个从执行引擎接收到的值赋给工作内存的变量，每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。
store：作用于工作内存的变量，它把工作内存中一个变量的值传送到主内存中，以便随后的write操作使用。
write：作用于主内存的变量，它把store操作从工作内存中得到的变量的值放入主内存的变量中。

如果要把一个变量从主内存复制到工作内存，那就要顺序地执行read和load操作，如果要把变量从工作内存同步回主内存，就要顺序地执行store和write操作。

注意，Java内存模型只要求上述两个操作必须按顺序执行，而没有保证是连续执行。

另外规定了以下规则:

不允许read和load、store和write操作之一单独出现，即不允许一个变量从主内存读取了但工作内存不接受，或者从工作内存发起回写了但主内存不接受的情况出现。
不允许一个线程丢弃它的最近的assign操作，即变量在工作内存中改变了之后必须把该
变化同步回主内存。
不允许一个线程无原因地（没有发生过任何assign操作）把数据从线程的工作内存同回主内存中。
一个新的变量只能在主内存中“诞生”，不允许在工作内存中直接使用一个未被初始化（load或assign）的变量，换句话说，就是对一个变量实施use、store操作之前，必须先执行过了assign和load操作。
一个变量在同一个时刻只允许一条线程对其进行lock操作，但lock操作可以被同一条线程重复执行多次，多次执行lock后，只有执行相同次数的unlock操作，变量才会被解锁。如果对一个变量执行lock操作，那将会清空工作内存中此变量的值，在执行引擎使用这个变量前，需要重新执行load或assign操作初始化变量的值。
如果一个变量事先没有被lock操作锁定，那就不允许对它执行unlock操作，也不允许去unlock一个被其他线程锁定住的变量。
对一个变量执行unlock操作之前，必须先把此变量同步回主内存中（执行store、write操作）。

volatile型变量的特殊规则

“可见性”:指当一条线程修改了这个变量的值，新值对于其他线程来说是可以立即得知的，即工作内存中，每当要使用该值的时候都要从主内存中刷新该值。

但需要注意的是只有当某个操作具备原子性的时候才能保证volatile型变量的值是线程安全的，当操作不是原子性的时候不能保证其是线程安全的。例如:

public class VolatileTest {
    public static volatile int rare=0;

    public static void increase(){
        rare++;
    }

    private static final int THREADS_COUNT=20;

    public static void main(String[] args) throws InterruptedException {
        Thread[] threads=new Thread[THREADS_COUNT];
        for(int i=0;i<THREADS_COUNT;i++){
            threads[i]=new Thread(new Runnable() {
                public void run() {
                    for (int i=0;i<10000;i++){
                        increase();
                    }
                }
            });
            threads[i].start();
        }
        //等待所有累加线程结束
        for(int i=0;i<THREADS_COUNT;i++){
            threads[i].join();
            Thread.yield();
        }
        System.out.println(rare);
    }
}

这段代码执行后结果经常是不一样的。

原因:++操作并不是原子性的:

[外链图片转存失败(img-ewGIvQbd-1562727325398)(/1562639983838.png)]

只有当入栈的时候才是线程安全的，保证了可见性，++与出栈回写至主内存这段时间并不是线程安全的，其他线程可能在这段时间中读取该值，然后进行++与回写操作，导致一开始读取的值过期，无法保证线程安全。

并且还需要注意的一点是，一行字节码也不一定是一个原子操作。

由于volatile变量只能保证可见性，在不符合以下两条规则的时候，我们仍然需要通过加锁的方式来保证原子性:

运算结果并不依赖变量的当前值，或者能够确保只有单一的线程修改变量的值。
变量不需要与其他的状态变量共同参与不变约束。

volatile使用场景:

public class VolatileUseDemo {
    volatile boolean shutdownRequested;
    public void setShutdownRequested(){
        shutdownRequested=true;
    }
    public void doWork(){
        while (!shutdownRequested){
            
        }
    }
}

使用volatile的第二个语义是禁止指令的重排序优化。普通的变量仅仅会保证在该方法的执行过程中所有依赖赋值结果的地方都能获取到正确的结果，而不能保证变量赋值操作的顺序与程序代码中的执行顺序一致。

Map configOptions；
char[]configText；
//此变量必须定义为volatile
volatile boolean initialized=false；
//假设以下代码在线程A中执行
//模拟读取配置信息，当读取完成后将initialized设置为true以通知其他线程配置可用
configOptions=new HashMap（）；
configText=readConfigFile（fileName）；
processConfigOptions（configText,configOptions）；
initialized=true；
//假设以下代码在线程B中执行
//等待initialized为true，代表线程A已经把配置信息初始化完成
while（！initialized）{
sleep（）；
}
//使用线程A中初始化好的配置信息
doSomethingWithConfig（）；

如果没有volatile修饰initialzed，那么可能会导致initialized提前被执行，干扰并发执行。

[外链图片转存失败(img-bnplSolo-1562727325399)(/1562649958976.png)]

通过对比就会发现，关键变化在于有volatile修饰的变量，赋值后（前面mov%eax0x150（%esi）这句便是赋值操作）多执行了一个“lock addl ＄0x0（%esp）”操作，这个操作相当于一个内存屏障（Memory Barrier或Memory Fence，指重排序时不能把后面的指令重排序到内存屏障之前的位置）

从硬件架构上讲，指令重排序是指CPU采用了允许将多条指令不按程序规定的顺序分开发送给各相应电路单元处理。但指令重排并不是随机重排，重排后结果要与顺序执行的一样，在一定程度上也算是有序的。

lock addl＄0x0，（%esp）指令把修改同步到内存时，意味着所有之前的操作都已经执行完成，这样便形成了“指令重排序无法越过内存屏障”的效果(利用了上文提到的指令重排的"有序")。

在某些情况下，volatile的同步机制的性能确实要优于锁（使用synchronized关键字或java.util.concurrent包里面的锁），但是由于虚拟机对锁实行的许多消除和优化，使得我们很难量化地认为volatile就会比synchronized快多少。

volatile变量读操作的性能消耗与普通变量几乎没有什么差别，但是写操作则可能会慢一些，因为它需要在本地代码中插入许多内存屏障指令来保证处理器不发生乱序执行。不过即便如此，大多数场景下volatile的总开销仍然要比锁低

规则:

在工作内存中，每次使用V前都必须先从主内存刷新最新的值，用于保证能看见其他线程对变量V所做的修改后的值
在工作内存中，每次修改V后都必须立刻同步回主内存中，用于保证其他线程可以看到自己对变量V所做的修改
这条规则要求volatile修饰的变量不会被指令重排序优化，保证代码的执行顺序与程序的顺序相同

对于long和double型变量的特殊规则

但是对于64位的数据类型（long和double），在模型中特别定义了一条相对宽松的规定：允许虚拟机将没有被volatile修饰的64位数据的读写操作划分为两次32位的操作来进行，即允许虚拟机实现选择可以不保证64位数据类型的load、store、read和write这4个操作的原子性，这点就是所谓的long和double的非原子性协定

如果有多个线程共享一个并未声明为volatile的long或double类型的变量，并且同时对它们进行读取和修改操作，那么某些线程可能会读取到一个既非原值，也不是其他线程修改值的代表了“半个变量”的数值。

但是目前的商用虚拟机基本都没有实现这一点，将long和double实现为具有原子性操作。

原子性，可见性与有序性

原子性

由Java内存模型来直接保证的原子性变量操作包括read、load、assign、use、store和write，我们大致可以认为基本数据类型的访问读写是具备原子性的

如果应用场景需要一个更大范围的原子性保证（经常会遇到），Java内存模型还提供了lock和unlock操作来满足这种需求，尽管虚拟机未把lock和unlock操作直接开放给用户使用，但是却提供了更高层次的字节码指令monitorenter和monitorexit来隐式地使用这两个操作，这两个字节码指令反映到Java代码中就是同步块——synchronized关键字，因此在synchronized块之间的操作也具备原子性。

可见性

可见性是指当一个线程修改了共享变量的值，其他线程能够立即得知这个修改。

Java内存模型是通过在变量修改后将新值同步回主内存，在变量读取前从主内存刷新变量值这种依赖主内存作为传递媒介的方式来实现可见性的

普通变量与volatile变量的区别是，volatile的特殊规则保证了新值能立即同步到主内存，以及每次使用前立即从主内存刷新。

Java还有两个关键字能实现可见性，即synchronized和final。

同步块的可见性是由“对一个变量执行unlock操作之前，必须先把此变量同步回主内存中（执行store、write操作）”这条规则获得的，而final关键字的可见性是指：被final修饰的字段在构造器中一旦初始化完成，并且构造器没有把“this”的引用传递出去，那在其他线程中就能看见final字段的值。

有序性

Java程序中天然的有序性可以总结为一句话：如果在本线程内观察，所有的操作都是有
序的；如果在一个线程中观察另一个线程，所有的操作都是无序的。

前半句是指“线程内表现为串行的语义”（Within-Thread As-If-Serial Semantics），后半句是指“指令重排序”现象和“工作内存与主内存同步延迟”现象。

Java语言提供了volatile和synchronized两个关键字来保证线程之间操作的有序性，volatile关键字本身就包含了禁止指令重排序的语义，而synchronized则是由“一个变量在同一个时刻只允许一条线程对其进行lock操作”这条规则获得的，这条规则决定了持有同一个锁的两个同步块只能串行地进入。

注意

synchronized虽然很“万能”，但是“万能”的代价就是性能的损耗。

先行发生规则

"先行发生"原则是判断数据是否存在竞争，线程是否安全的主要依据。

先行发生是Java内存模型中定义的两项操作之间的偏序关系，如果说操作A先行发生于操作B，其实就是说在发生操作B之前，操作A产生的影响能被操作B观察到，“影响”包括修改了内存中共享变量的值、发送了消息、调用了方法等

程序次序规则:在一个线程内，按照控制流程序，书写在前面的操作先行发生于书写在后面的操作。(指令重排是机器级别的操作，且同一个线程重排后执行结果相同)

管程锁定规则:一个unlock操作先行发生于后面对同一个锁的lock操作，"后面"是时间上的顺序

volatile变量规则:对一个volatile的写操作先行发生于后面对这个变量的读操作。

线程启动规则:Thread对象的start()方法先行发生于此线程的每一个动作

线程终止规则:线程中的所有操作都先行发生于对此线程的终止检测，我们可能通过Thread.join()方法结束，等手段检测到线程已经终止执行。

线程中断规则:线程的中断操作先于线程检测到中断的代码。

对象终结规则:一个对象的初始化完成(执行构造函数结束)先行发生于它的finalize()方法的开始。

传递性:如果操作A先行发生于操作B，操作B先行发生于操作C，则操作A先行发生于操作C。

private int value=0；
pubilc void setValue（int value）{
this.value=value；
}
public int getValue（）{
return value；
}

如果有两个线程A,B，A调用setValue方法而B调用getValue方法，根据上面的规则进行分析，这个操作不是线程安全的操作。

//以下操作在同一个线程中执行
int i=1；
int j=2；

该操作在同一个线程中执行，但由于指令重拍，j=2可能在时间上先于i=1被处理器执行，但该线程感受不到(不影响先行发生的正确性)，因此这是"先行发生的"。

一个操作"时间上的先发生"不等于"先行发生"，同样的"先行发生"也不等于"时间上的先发生"

Java与多线程

线程的实现

线程的优点:可以把一个进程的资源分配和执行调度分开，各个线程即可以共享进程资源(内存地址，文件I/O等)，又可以独立调度(线程是CPU的调度单位)

JAVA与线程实现的关系:主流的操作系统都提供了线程实现，JAVA语言则是提供了不同硬件或者操作系统下对线程进行操作的API，而且Thread类许多关键操作都是native方法，这意味着，JAVA对线程的实现实际上是对平台对线程实现的一层封装，不具备有平台无关性。

实现线程的主要方式:使用内核线程实现，使用用户线程实现和使用用户线程加轻量级进程混合实现。

1. 使用内核线程实现

内核线程就是直接由操作系统内核支持的线程，这种线程由内核来完成线程切换，内核通过操纵调度器对线程进行调度，并负责将线程的任务映射到各个处理器上。程序一般通过使用轻量级进行去操作内核线程。

[外链图片转存失败(img-26rTuMQb-1562727325402)(/1562660702656.png)]

优点:每个轻量级进程都成为一个独立的调度单元，即使有一个轻量级进程在系统调用中阻塞了，也不会影响整个进程继续工作。

缺点:系统调用的代价相对较高，需要在用户态和内核态来回切换。

2.使用用户线程实现

广义上讲一个线程只要不是内核线程，就可以认为是用户线程。

狭义上的用户线程是指完全建立在用户空间的线程库上，系统内核不能感知存在的实现。

优点:线程操作(创建，销毁，同步和调度)不需要切换到内核态，操作是非常快速且低消耗的。

缺点:没有系统内核的支援，所有线程操作都需要用户程序处理，由于操作系统只把处理器资源分配到进程，那诸如"阻塞如何处理"，“多处理器系统中如何将线程映射到其他处理器上”这类问题解决起来将会异常困难，甚至不可能完成。

[外链图片转存失败(img-oQogQNWB-1562727325403)(/1562661286052.png)]

3.使用用户线程增加轻量级进程混合实现

既存在用户线程又存在轻量级进程。用户线程的线程操作代价依然低廉，而且系统提供支持的轻量级进程则作为用户线程和内核线程之间沟通的桥梁，可以使用内核提供的线程调度功能以及处理器映射，并且用户线程的系统调用通过内核线程来完成，大大降低了整个进程被完全阻塞的风险。

[外链图片转存失败(img-fhIW4HFH-1562727325405)(/1562661304815.png)]

4.Java线程的实现

不同的平台有不同的实现，在windows和linux中使用的是一对一模型。

Java线程调度

主要有两种调度方式，一种是协同式线程调度，另外一种是抢占式线程调度。

协调式线程调度:线程执行时间由自己来控制，一个线程做完自己要做的事情后，主动通知系统切换到另一个线程上面。坏处:线程执行时间不可控，如果一个线程编写有问题，一直不告诉系统进行线程切换，那么程序就一直阻塞。

抢占式线程调度：每个线程将由系统来分配执行时间，线程的切换不由线程本身来决定(JAVA 中 Thread.yield（）只能让出执行时间，并不能获取执行时间)。这种情况下线程执行时间可控，不会出现进程阻塞问题。

虽然Java的线程调度是通过系统来调度的，不过我们可以“建议”系统多分配一些时间给"优先级别"高的线程。

但是注意Java中线程的”优先级“是不可靠的。"优先级"的可靠取决于操作系统，有的操作系统各个"优先级"都是一样的(没有提供线程优先级)，有的操作系统"优先级"的分级和Java的不太一样，比Java线程优先级多的系统还好说，中间留下一点空位就可以了，但比Java线程优先级少的系统，就不得不出现几个优先级相同的情况了。

[外链图片转存失败(img-CbXxb9FG-1562727325409)(/1562662302864.png)]

而且还有一点线程优先级可能会被系统的一些机制所改变。

状态转换

线程状态(任意一个时间点，一个线程有且只有一个状态)

新建（New）：创建后尚未启动的线程处于这种状态。
运行（Runable）：Runable包括了操作系统线程状态中的Running和Ready，也就是处于此状态的线程有可能正在执行，也有可能正在等待着CPU为它分配执行时间。
无限期等待（Waiting）：处于这种状态的线程不会被分配CPU执行时间，它们要等待被其他线程显式地唤醒。以下方法会让线程陷入无限期的等待状态：
●没有设置Timeout参数的Object.wait（）方法。
●没有设置Timeout参数的Thread.join（）方法。
●LockSupport.park（）方法。
限期等待（Timed Waiting）：处于这种状态的线程也不会被分配CPU执行时间，不过无须等待被其他线程显式地唤醒，在一定时间之后它们会由系统自动唤醒。以下方法会让线程进入限期等待状态：
●Thread.sleep（）方法。
●设置了Timeout参数的Object.wait（）方法。
●设置了Timeout参数的Thread.join（）方法。
●LockSupport.parkNanos（）方法。
●LockSupport.parkUntil（）方法。
阻塞（Blocked）：线程被阻塞了，“阻塞状态”与“等待状态”的区别是：“阻塞状态”在等待着获取到一个排他锁，这个事件将在另外一个线程放弃这个锁的时候发生；而“等待状态”则是在等待一段时间，或者唤醒动作的发生。在程序等待进入同步区域的时候，线程将进入这种状态。
结束（Terminated）：已终止线程的线程状态，线程已经结束执行。

[外链图片转存失败(img-enYTyAtH-1562727325409)(/1562662569352.png)]