困惑:刚开始学习并发编程的时候,总会听到一个词:CAS,经常会被其搞懵,不知道CAS到底是什么,用来干什么的,只知道糊里糊涂的理解,感觉懂一点,又感觉少了些什么。所以,为了能彻底搞懂这个玩意儿,写一篇学习笔记谈谈对CAS的理解。
什么是CAS算法
CAS(CompareAndSwap, 比较并交换)算法其实是计算机硬件对于并发操作共享数据的支持,保证了数据的原子性。
其实,CAS算法理解起来非常简单,CAS包含三个操作数:内存值 V;预估值(expect) A;更新值(update) B;
- 比较 A 与 V 是否相等。(比较)
- 如果比较相等,将 B 写入 V。(交换)
- 返回操作是否成功。
下面是一个简单模拟CAS操作过程的代码:
/**
* 模拟CAS算法
*
*/
public class TestCompareAndSwap {
public static void main(String[] args) {
final CompareAndSwap cas = new CompareAndSwap();
for (int i = 0; i < 10; i++) {
new Thread(new Runnable() {
@Override
public void run() {
int expectedValue = cas.get();
boolean b = cas.compareAndSet(expectedValue, (int) (Math.random() * 101));
System.out.println(b);
}
}).start();
}
}
}
class CompareAndSwap {
//内存值
private int value;
//获取内存值
public synchronized int get() {
return value;
}
//比较
public synchronized int compareAndSwap(int expectedValue, int newValue) {
int oldValue = value;
//判断内存值是否等于预期值,如果相等说明内存值没有被其他线程修改,
//则将新值赋给内存值。如果不相等,说明内存值已经被其他线程修改过了.
if (oldValue == expectedValue) {
this.value = newValue;
}
//不管是否成功都会将内存值返回
return oldValue;
}
//设置
public synchronized boolean compareAndSet(int expectedValue, int newValue) {
return expectedValue == compareAndSwap(expectedValue, newValue);
}
}
谈谈原子性
上面谈到,CAS算法是用来解决并发编程中出现的原子性问题的(微观上看汇编的 CAS 是实现操作系统级别的原子操作的基石。从编程语言角度来看 CAS 是实现多线程非阻塞操作的基石。),那什么是原子性问题呢?原子性是并发过程中所需处理的三个问题之一(其他两个分别是可见性和有序性)。
原子本意是“不能被进一步分割的最小粒子”,而原子操作意为“不可被中断的一个或一系列操作”。
典型的原子性操作即 i++ 操作,我们知道其实在计算机底层的话,i++ 是被分为如下三步的,分别为:“读-改-写”
- int temp = i; 产生一个临时变量temp,将i的值赋给临时变量temp.
- i = i + 1; i+1
- i = temp; 再将temp的值赋给i
虽然 i++ 操作在底层被分为了三步进行,但是三步操作是一个原子操作,是不可分割的。但是在并发编程中,由于多个线程对共享变量的访问,就会导致原子性问题,看下面的代码:
public class AtomicDemo implements Runnable {
private int value = 0;
// AtomicInteger value = new AtomicInteger(0);
@Override
public void run() {
try {
Thread.sleep(2000);
} catch (InterruptedException e) {
e.printStackTrace();
}
System.out.println(getValue());
}
public int getValue() {
// return value.getAndIncrement();
return value++;
}
}
class Test1 {
public static void main(String[] args) {
AtomicDemo atomicDemo = new AtomicDemo();
// synchronized (atomicDemo) {
for (int i = 0; i < 10; i++) {
new Thread(atomicDemo).start();
}
// }
}
}
结果:
0 0 1 2 4 3 5 6 7 8
既然出现了问题,那怎么解决呢?
- 使用synchronized关键字为代码块或者方法上锁
- 使用JDK 1.5 java.util.concurrent 包中所提供的原子类:这里话做一个说明,一般来说,原子性问题经常出现在对于基本数据类型的多线程访问中,所以JDK专门提供了这个原子包进行处理,当然也不排除有其他的情况。
以其中的 AtomicInteger举例,其中的方法如下:
//构造器
public AtomicInteger()
public AtomicInteger(int initialValue)
//一般方法
public final int get() 获取当前值
public final void set(int newValue) 设置为给定值
public final boolean compareAndSet(int expect, int update)
如果当前值 == 预期值,则以原子方式将该值设置为给定的更新值。
public final int getAndIncrement() 以原子方式将当前值加 1 i++
public final int getAndDecrement() 以原子方式将当前值减 1 i--
public final int incrementAndGet() 以原子方式将当前值加 1 ++i
public final int decrementAndGet() 以原子方式将当前值减 1 --i
...
下面我们看一下AtomicInteger中的部分源码:
public final boolean compareAndSet(int expect, int update) {
return unsafe.compareAndSwapInt(this, valueOffset, expect, update);
}
我们发现,其实AtomicInteger的源码实现也是用到了CAS算法。
Java如何实现原子操作
上面介绍一个简单的原子性问题和两种基本的解决思路:上锁或者使用原子包。那么在Java中是如何实现原子操作的呢?其实下面要讲的也就是上面两种方法,只是做了一点扩充。
在Java中可以通过锁和循环CAS的方式实现原子操作。
(1)使用循环CAS实现原子操作
VM中的CAS操作正是利用了处理器提供的CMPXCHG指令实现的。自旋CAS实现的基本思路就是循环进行CAS操作直到成功为止,以下代码实现了一个基于CAS线程安全的计数器方法safeCount和一个非线程安全的计数器count。
public class Counter {
private AtomicInteger atomicI = new AtomicInteger(0);
private int i = 0;
public static void main(String[] args) {
final Counter cas = new Counter();
List<Thread> ts = new ArrayList<Thread>(600);
long start = System.currentTimeMillis();
for (int j = 0; j < 100; j++) {
Thread t = new Thread(new Runnable() {
@Override
public void run() {
for (int i = 0; i < 10000; i++) {
cas.count();
cas.safeCount();
}
}
});
ts.add(t);
}
for (Thread t : ts) {
t.start();
}
// 等待所有线程执行完成
for (Thread t : ts) {
try {
t.join();
} catch (InterruptedException e) {
e.printStackTrace();
}
}
System.out.println(cas.i);
System.out.println(cas.atomicI.get());
System.out.println(System.currentTimeMillis() - start);
}
/**
* 使用CAS实现线程安全计数器
*/
private void safeCount() {
for (;;) {
int i = atomicI.get();
boolean suc = atomicI.compareAndSet(i, ++i);
if (suc) {
break;
}
}
}
/**
* 非线程安全计数器
*/
private void count() {
i++;
}
}
(2)使用锁机制实现原子操作
锁机制保证了只有获得锁的线程能够操作锁定的内存区域。JVM内部实现了很多种锁机制,有偏向锁,轻量级锁和互斥锁,有意思的是除了偏向锁,JVM实现锁的方式都用到的循环CAS,当一个线程想进入同步块的时候使用循环CAS的方式来获取锁,当它退出同步块的时候使用循环CAS释放锁。
CAS实现原子操作的三大问题
- ABA问题。因为CAS需要在操作值的时候检查下值有没有发生变化,如果没有发生变化则更新,但是如果一个值原来是A,变成了B,又变成了A,那么使用CAS进行检查时会发现它的值没有发生变化,但是实际上却变化了。ABA问题的解决思路就是使用版本号。在变量前面追加上版本号,每次变量更新的时候把版本号加一,那么A-B-A 就会变成1A-2B-3A。
从Java1.5开始JDK的atomic包里提供了一个类AtomicStampedReference来解决ABA问题。这个类的compareAndSet方法作用是首先检查当前引用是否等于预期引用,并且当前标志是否等于预期标志,如果全部相等,则以原子方式将该引用和该标志的值设置为给定的更新值。
public boolean compareAndSet
(V expectedReference,//预期引用
V newReference,//更新后的引用
int expectedStamp, //预期标志
int newStamp) //更新后的标志 {
Pair<V> current = pair;
return
expectedReference == current.reference &&
expectedStamp == current.stamp &&
((newReference == current.reference &&
newStamp == current.stamp) ||
casPair(current, Pair.of(newReference, newStamp)));
}
-
循环时间长开销大。自旋CAS如果长时间不成功,会给CPU带来非常大的执行开销。如果JVM能支持处理器提供的pause指令那么效率会有一定的提升,pause指令有两个作用,第一它可以延迟流水线执行指令(de-pipeline),使CPU不会消耗过多的执行资源,延迟的时间取决于具体实现的版本,在一些处理器上延迟时间是零。第二它可以避免在退出循环的时候因内存顺序冲突(memory order violation)而引起CPU流水线被清空(CPU pipeline flush),从而提高CPU的执行效率。
-
只能保证一个共享变量的原子操作。当对一个共享变量执行操作时,我们可以使用循环CAS的方式来保证原子操作,但是对多个共享变量操作时,循环CAS就无法保证操作的原子性,这个时候就可以用锁,或者有一个取巧的办法,就是把多个共享变量合并成一个共享变量来操作。比如有两个共享变量i=2,j=a,合并一下ij=2a,然后用CAS来操作ij。从Java1.5开始JDK提供了AtomicReference类来保证引用对象之间的原子性,你可以把多个变量放在一个对象里来进行CAS操作。