Copy-On-Write写时复制机制与Java中CopyOnWriteArrayList容器源码实现

青鱼入云

已于 2023-11-21 16:20:07 修改

阅读量1.6k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： java java并发编程文章标签： java 开发语言

于 2018-06-03 15:16:05 首次发布

本文链接：https://blog.youkuaiyun.com/u011305680/article/details/80555173

java 同时被 2 个专栏收录

71 篇文章

订阅专栏

java并发编程

19 篇文章

订阅专栏

本文深入探讨了Copy-on-Write(COW)机制的基本原理及其在CopyOnWriteArrayList中的实现方式。介绍了COW机制如何通过延迟写策略实现线程安全，并分析了其优缺点及适用场景。

1. Copy-on-Write理解

Copy-on-Write机制简称COW，是一种并发设计策略，主要应用于需要频繁读取但很少修改的数据结构上。其基本思路是多线程同时共享同一个内容，当某个线程想要修改这个内容的时候，我们不在原有内存块中进行写操作，而是将内存拷贝一份，在新的内存中进行写操作，写完之后呢，就将指向原来内存指针指向新的内存，原来的内存就可以被回收掉了！这个过程其它的线程继续读旧的内容，直到修改完成。这是一种延时懒惰策略。
Copy-on-Write有那么几个应用场景：

linux系统中内存的管理和分配。参考：写时复制机制
redis快照持久化(bgm)时，会fork出一个子进程进行持久化操作，当主进程接收到写操作时，会copy出一份新的内存，对新的内存进行写操作。
jdk1.5引入了juc包下的CopyOnWriteArrayList和CopyOnWriteArraySet。

2. CopyOnWriteArrayList源码解析

我们这里来看下CopyOnWriteArrayList源码。在向ArrayList中添加元素时，是要加锁的，否则多线程写就会Copy出N个副本出来。

public class CopyOnWriteArrayList<E>
    implements List<E>, RandomAccess, Cloneable, java.io.Serializable {
    //写时需要加锁
    final transient ReentrantLock lock = new ReentrantLock();

    //在修改之后需要保证其他读线程能立刻读到新数据
    private transient volatile Object[] array;
    
    final Object[] getArray() {
        return array;
    }

    final void setArray(Object[] a) {
        array = a;
    }
    //增加元素时需要加锁
    public boolean add(E e) {
        final ReentrantLock lock = this.lock;
        lock.lock();
        try {
            Object[] elements = getArray();
            int len = elements.length;
            Object[] newElements = Arrays.copyOf(elements, len + 1);  //复制出一份新的数组，长度加一
            newElements[len] = e;  //把新元素加在末尾
            setArray(newElements);  //引用改为新建的副本数组
            return true;
        } finally {
            lock.unlock();
        }
    }
    //获取数组中的元素，一律从旧的数组中读
    public E get(int index) {
        return get(getArray(), index);
    }
}

3. CopyOnWriteArrayList优缺点

优点：

线程安全。CopyOnWriteArrayList是线程安全的，由于写操作对原数据进行复制，因此写操作不会影响读操作，读操作可以不加锁，降低了并发冲突的概率。
不会抛出ConcurrentModificationException异常。由于读操作遍历的是不变的数组副本，因此不会抛出ConcurrentModificationException异常。

缺点：

写操作性能较低。由于每一次写操作都需要将元素复制一份，因此写操作的性能较低。
内存占用增加。由于每次写操作都需要创建一个新的数组副本，因此内存占用会增加，特别是当集合中有大量数据时，内存占用较高。
数据一致性问题。由于读操作遍历的是不变的数组副本，因此在对数组执行写操作期间，读操作可能读取到旧的数组数据，这就涉及到数据一致性问题。