决战超越并发瓶颈---解决并发难题-优快云博客

本文链接：https://blog.youkuaiyun.com/xiaoxu2022xiaoxu/article/details/140862541

转载来自于张彦峰ZYF大佬的：超越并发瓶颈：CAS与乐观锁的智慧应用_系统自动流转-优快云博客

synchronized 是 Java 内置的同步机制，依赖 JVM 实现，通过进入和退出监视器锁（Monitor Lock）来保证线程的安全性。在高并发情况下，线程可能会频繁地在 BLOCKED 状态和 RUNNABLE 状态之间切换，导致用户态和内核态的频繁切换，从而影响性能。

而Lock（如 ReentrantLock）是基于 AQS 实现，通过使用自旋锁和非阻塞算法，减少了用户态和内核态的切换，提高了性能。

与 synchronized 的实现方式不同，AQS中很多数据结构的变化，都是依赖 CAS 进行操作的，而CAS 就是乐观锁的一种实现。

一、走进CAS

这里我们直接简单理解即可，如果想深入可见：揭秘CAS：深入理解与应用解析-优快云博客。

（一）基本知识快速回顾

CAS（Compare And Swap）技术是一种常用的并发编程技术，用于解决多线程环境下的数据竞争问题。它是无锁（lock-free）算法的一种实现方式，通过原子操作实现了线程安全的数据更新。

CAS操作通常包括三个参数：内存地址（或变量），期望值和新值。

它的执行过程如下：

比较：CAS操作首先比较内存地址中的值与期望值是否相等。
交换：如果相等，CAS操作将新值写入内存地址，否则不进行任何操作。
返回：CAS操作返回内存地址中的旧值。

CAS操作在执行过程中具有原子性，即在比较和交换的过程中不会被其他线程干扰。这样可以确保多线程环境下数据的一致性和正确性。

分类	具体说明	解释
优点	无锁特性	CAS操作不需要使用传统的锁机制，避免了锁带来的开销和竞争问题，提高了并发性能和可伸缩性。
	原子性	CAS操作是原子的，不会发生线程间的竞争和数据不一致的问题。
	适用范围广	CAS操作可以用于实现各种同步原语和数据结构，如原子操作、乐观锁、无锁队列等。
缺点	ABA问题	CAS操作无法检测到其他线程在执行过程中对值的修改。例如，一个值原先是A，然后被修改为B，最后又被修改回A，这时CAS操作无法区分这种情况，会错误地认为值没有被修改过。
	自旋开销	如果CAS操作失败，会进入自旋状态，不断重试直到成功。自旋会占用CPU资源，当自旋次数过多时，会导致性能下降。
	并发度限制	CAS操作在并发度较高的情况下，由于竞争激烈，可能会导致大量的CAS操作失败，进而影响性能。

在实际应用中，CAS技术常用于实现线程安全的数据结构和算法，例如并发队列、计数器、自旋锁等。它在一些高并发场景下能够提供较好的性能和可伸缩性，但需要注意处理ABA问题和合理控制自旋次数，以及根据具体场景评估并发度的限制。

（二）CAS 的原子性实际上是硬件 CPU 直接保证的

直接以AtomicInteger 中 CAS 操作的原子性保证来进行理解。

Java 层次

AtomicInteger 类中的 compareAndSet 方法用于执行 CAS 操作，其代码如下：

这里的 U 是 Unsafe 类的实例，VALUE 是内存偏移量。compareAndSetInt 是 Unsafe 类中的一个本地方法，直接调用底层的硬件指令来实现原子操作。

JVM 层次

Unsafe 类中 compareAndSetInt 方法的实现会调用 weakCompareAndSetInt 方法，该方法通过自旋重试实现CAS操作：

在这个方法中，getIntVolatile 获取当前值，weakCompareAndSetInt 尝试更新值，如果更新失败，则重复上述过程，直到成功，即自旋重试。

硬件层次

在 Linux 系统的 x86 架构上，CAS 操作最终会映射到 cmpxchgl 汇编指令，这是由 os_cpu/linux_x86/atomic_linux_x86.hpp 文件中的代码实现的：

这里的 cmpxchgl 指令是关键。这条汇编指令的作用是：

比较寄存器 EAX 中的值（compare_value）和内存地址 dest 中的值。
如果两者相等，则将 exchange_value 存储到 dest 中。
如果不相等，则将 dest 中的值加载到 EAX 中。

lock 前缀确保了操作的原子性，这意味着在多处理器系统中，该指令在执行时会锁住总线或使用缓存一致性协议，保证其他处理器不能访问内存地址，直到操作完成。

在不同的硬件平台上，支持CAS操作的指令可能不同，但其基本原理是一致的：

x86 平台：x86处理器提供了 CMPXCHG 指令来实现CAS操作。这个指令是原子的，即在执行过程中，不会被其他指令中断。
PowerPC 平台：PowerPC处理器提供了 lwarx 和 stwcx. 指令组合来实现CAS操作，这些指令也确保了操作的原子性。
ARM 平台：ARM处理器提供了 LDREX 和 STREX 指令组合来实现CAS操作。

总结

硬件指令 cmpxchgl 结合 lock 前缀保证了在多处理器环境下的原子性，即整个比较和替换操作是不可分割的，这就是 CAS 操作能够实现原子性的原因。

（三）性能检测说明

为了验证原子类的性能优势，可以编写一个简单的测试程序，分别使用 AtomicInteger（CAS 实现）和 synchronized 关键字来实现一个计数器，并进行多线程并发访问，最后比较它们的性能。具体代码如下：

运行结果如下：

AtomicInteger 总耗时：6754 毫秒，AtomicInteger 计数结果：100000000
synchronized 总耗时：2409 毫秒，synchronized 计数结果：100000000

数据说明使用 synchronized 关键字的方式比使用 AtomicInteger 类的方式具有更好的性能。

二、理解乐观锁

（一）直观的理解

CAS（Compare-And-Swap）可以被看作是乐观锁的一种实现方式。

乐观锁认为自己在使用数据时不会有别的线程修改数据，所以不会添加锁，只是在更新数据的时候去判断之前有没有别的线程更新了这个数据。如果这个数据没有被更新，当前线程将自己修改的数据成功写入。如果数据已经被其他线程更新，则根据不同的实现方式执行不同的操作（例如报错或者自动重试）

在Java中是通过使用无锁编程来实现，最常采用的是CAS算法，Java原子类中的递增操作就通过CAS自旋实现的。（可见Java中常用的锁总结与理解_java锁用来解决什么-优快云博客）

（二）乐观锁适用于读多写少的情况的原因

乐观锁不阻塞读操作：乐观锁在读取数据时并不会进行加锁操作，而是先读取数据，然后在更新数据时检查是否被其他线程修改过。因此，即使有写操作正在进行，读操作也不会被阻塞，从而可以实现读操作的并发执行。
乐观锁的冲突少：在读多写少的情况下，写操作的频率较低，因此冲突的概率也相对较低。乐观锁的重试操作是在发生冲突时进行的，因此在冲突较少的情况下，重试的概率也较低，从而可以更高效地处理并发冲突。
乐观锁的开销低：乐观锁的实现通常比较轻量级，不需要频繁地进行加锁和解锁操作，因此在读多写少的情况下，乐观锁的性能通常会更好。