Java学习笔记——集合III

最新推荐文章于 2025-10-28 23:49:48 发布

原创最新推荐文章于 2025-10-28 23:49:48 发布 · 163 阅读

0 ·

CC 4.0 BY-SA版权

学习笔记专栏收录该内容

5 篇文章

订阅专栏

本文探讨了Java集合类的线程安全问题，包括ArrayList在多线程环境下的ConcurrentModificationException异常，以及如何解决线程安全。文章介绍了线程安全的集合类如Vector、HashTable，以及JUC包下的CopyOnWriteArrayList和ConcurrentHashMap。重点讲解了CopyOnWriteArrayList的读写分离策略和ConcurrentHashMap在JDK1.7与1.8的不同实现，强调了它们在并发场景下的高效性和安全性。

Java学习笔记——集合III

线程安全的集合类

集合的线程安全问题

fast-fail 机制 —— 多个线程（通常情况下），在结构上对集合进行改变时。就有可能触发fast-fail机制，抛出java.util.ConcurrentModificationException异常

代码实例

public static void main(String[] args) {
    ArrayList<Integer> list = new ArrayList<>();
    for (int i = 0; i < 10; i++) {
        list.add(i);
    }
    //多线程对list操作
    //线程A对list进行遍历
    new Thread(() ->{
        for (Integer i : list) {
            System.out.println(i);		//Exception in thread "A" java.util.ConcurrentModificationException
        }
    } , "A").start();
    //线程B对list进行添加操作
    new Thread(() ->{
        for (int i = 0; i < 10; i++) {
            list.add(i);
        }
    },"B").start();
}

以ArrayList为例对集合进行遍历时，当调用内部迭代器的next方法时，会先调用checkForComodification方法

int expectedModCount = modCount; //开始遍历时，将modCount复制给expectedModCount

//而当调用add、remove等方法时 modCount会执行++ 操作
final void checkForComodification() {
    if (modCount != expectedModCount)		//当遍历时 ，如果其他线程对modCount进行了更改，则会使次条件为真
        throw new ConcurrentModificationException();
}

常见的集合类，HashMap、LinkedList、ArrayList均为线程不安全的线程实现类

解决线程安全的三种方式

1）采用线程安全的集合类如Vector、HashTable等、此类集合中增删改查等方法均为同步方法

//Vector类中的get方法，使用synchronized同步
public synchronized E get(int index) {
    if (index >= elementCount)
        throw new ArrayIndexOutOfBoundsException(index);

    return elementData(index);
}

但也因此，效率较低，现在较少采用

2）应用Collections.synchronizedList( List list ) / synchronizedMap(Map map) 方法

public E get(int index) {
	synchronized (mutex) {return list.get(index);}  //本质也是将集合中的方法进行同步
}

3）采用JUC包下提供的集合类CopyOnWriteArrayList 、 ConcurrentLinkedQueue、ConcurrentHashMap

CopyOnWriteArrayList

java.util.concurrent包下的线程安全的ArrayList

public class CopyOnWriteArrayList<E>
    implements List<E>, RandomAccess, Cloneable, java.io.Serializable {
    
    // 底层依然是数组，只不过是volatile
    private transient volatile Object[] array;
    
    // 实例维护了一个可重入锁
    final transient ReentrantLock lock = new ReentrantLock();
    
    //获取size（）、get（）等方法并没有进行同步
    public int size() {
        return getArray().length;
    }

}

add 、 remove等方法，进行了同步

add方法

//默认的add方法（在队尾添加）
public boolean add(E e) {
    final ReentrantLock lock = this.lock;
    lock.lock();
    try {
        Object[] elements = getArray();
        int len = elements.length;
        Object[] newElements = Arrays.copyOf(elements, len + 1);	//复制了一份数组，长度为原数组长度加一
        newElements[len] = e;	//将欲添加的值赋值给数组的末尾
        setArray(newElements); //将新的数组重新赋值给array
        return true;
    } finally {
        lock.unlock();
    }
}

remove方法

public E remove(int index) {
    final ReentrantLock lock = this.lock;
    lock.lock();
    try {
        Object[] elements = getArray();
        int len = elements.length;
        E oldValue = get(elements, index);
        int numMoved = len - index - 1;
        if (numMoved == 0)
            setArray(Arrays.copyOf(elements, len - 1));
        else {
            //新的数组长度为原数组长度减一
            Object[] newElements = new Object[len - 1]; 
            //将除欲删除元素之外的元素拷贝到新数组中
            System.arraycopy(elements, 0, newElements, 0, index);	
            System.arraycopy(elements, index + 1, newElements, index,
                             numMoved);
            //将新数组赋值给array
            setArray(newElements);
        }
        return oldValue;
    } finally {
        lock.unlock();
    }
}

set等方法类似

总结：

CopyOnWriteArrayList中，采用了读写分离的方式，对于读/获取长度等方法并未同步，而对于增删改等方法，采取了同步的方式，复制一份数组，对新的数组进行操作，操作完之后再将新的数组赋值给array，此过程中，并不影响其他线程的读操作。对于大多数场景下，此种方法即兼顾了效率，又解决了线程安全的问题。

ConcurrentHashMap

ConcurrentHashMap 同是juc包下的集合类，可以看作是线程安全的ConcurrentHashMap

该类在JDK1.7 与 JDK1.8 中的实现有所不同。

jdk1.7中的实现

jdk1.7中该类的实现原理就是将数据一段一段的存储，然后把每一段数据配一把锁。当以个线程占用锁访问其中一段数据的时候，其他段的数据也能被锁访问

初始化

1）初始化segment数组长度通过ConcurrencyLevel得出（一定为2^n）

2）初始化segmentShift与segmentMask —— 用于定位segment

3）初始化每个segment —— HashEntry数组（默认大小为容量 / segments的长度（取>= 其的2^n））

jdk1.8中的实现

jdk1.8中ConcurrentHashMap的实现和之前有所不同，取消了Segment的概念，采用CAS与Synchronized的方式进行加锁，对集合的线程安全进行保障

一些重要的成员参数

简单列举部分ConcurrentHashMap中重要的变量

/*
sizeCtl：
     0 未初始化，且数组的初始容量为16
     正数	初始容量 / 扩容阈值 （容量 * 加载因子）
     -1	正在进行初始化
     其他负数		（-1 + n）正在扩容的线程个数 = n
*/
private transient volatile int sizeCtl;

// 静态内部类Node —— 替换HashEntry
static class Node<K,V> implements Map.Entry<K,V>

// table Node数组
transient volatile Node<K,V>[] table;

// 另一个Node数组 ， 仅在扩容的时候非空
private transient volatile Node<K,V>[] nextTable;

// BaseCount 用于统计Size
private transient volatile long baseCount;

// CounterCell 底层维护一个volatile的long值，用于统计Size
static final class CounterCell {
    volatile long value;
    CounterCell(long x) { value = x; }
}

// 内部类ForwardingNode 代表数组正在扩容
static final class ForwardingNode<K,V> extends Node<K,V>

初始化

该类的初始化数组长度，计算方法与之前版本以及HashMap的计算方法有所不同

相同的是ConcurrentHashMap也在第一次调用put方法之后，才对数组进行初始化

public ConcurrentHashMap(int initialCapacity) {
    if (initialCapacity < 0)
        throw new IllegalArgumentException();
    int cap = ((initialCapacity >= (MAXIMUM_CAPACITY >>> 1)) ?
               MAXIMUM_CAPACITY :
               //tableSizeFor方法返回大于输入参数且最接近的2的整数次幂的数
               //不同于HashMap，该类的容量为1.5倍参数 + 1的大于等于其的2的整数次幂
               tableSizeFor(initialCapacity + (initialCapacity >>> 1) + 1)); 
    this.sizeCtl = cap;
}

扩容

1.8中的扩容，仍然采用分治的方式，每个线程负责一部分（扩容线程最多为CPU核数），每个线程最少负责的桶数为16，以下，对于扩容具体的实现进行了简单的解释

 private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
     //stride —— 每个线程需要负责的桶的个数
     if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
            stride = MIN_TRANSFER_STRIDE; // 最小值为16
     
     if (nextTab == null) {...} // 如果nextTab为空，就先创建一个数组，长度为原数组的2倍（n << 1）
     
     // ForwardingNode用于标识桶是否已被扩容
     ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);
     
     // 具体扩容的过程，bound，i 用于标识索引与边界
     for (int i = 0, bound = 0;;) {
          while (advance) {} // 内部用于定位本轮需要处理的桶区间
     }
     if (i < 0 || i >= n || i + n >= nextn) {} //最后一个扩容线程的一些收尾工作
     else if ((f = tabAt(tab, i)) == null)
                advance = casTabAt(tab, i, null, fwd); // 桶位为空，直接方式forwardingNode
     else if ((fh = f.hash) == MOVED)
                advance = true; // 遇到fwd，同样跳过
     else {
              synchronized (f) {} //否则，对于头节点加锁，进行扩容（与HashMap类似两个链表loTail、hiTail，分别放置在对应的位置）
     }
 }