JDK容器与并发—List—CopyOnWriteArrayList

本文详细介绍了CopyOnWriteArrayList的数据结构、线程安全机制及其实现原理,包括构造器、增删改查方法和迭代器的使用。适用于读多写少场景。

概述

      俗称读写ArrayList,线程安全的ArrayList版本,其所有写操作都是基于底层数组的副本操作,成功后再替换底层数组,可以理解为基于"snapshot" array的并发,适用于读多写少的并发环境。

1)采用"snapshot"  iterator,在遍历过程中,底层数组是不会修改的,不存在并发干扰,不会抛出ConcurrentModificationException异常;

2)遵守内存一致性:一个线程中先于“某元素添加到CopyOnWriteArrayList”的操作happen-before另一个线程中后于“从中获取或删除该元素”的操作。

数据结构

      基于数组,采用一把写锁:

    /** The lock protecting all mutators */
    transient final ReentrantLock lock = new ReentrantLock();

    /** The array, accessed only via getArray/setArray. */
    private volatile transient Object[] array;

构造器

// 无参构造,将底层数组设置为空数组
public CopyOnWriteArrayList() {
	setArray(new Object[0]);
}

// 带Collection参数构造
public CopyOnWriteArrayList(Collection<? extends E> c) {
	Object[] elements = c.toArray();
	// c.toArray might (incorrectly) not return Object[] (see 6260652)
	if (elements.getClass() != Object[].class)
		elements = Arrays.copyOf(elements, elements.length, Object[].class);
	setArray(elements);
}

// 带数组参数构造
public CopyOnWriteArrayList(E[] toCopyIn) {
	setArray(Arrays.copyOf(toCopyIn, toCopyIn.length, Object[].class));
}

增删改查

public boolean add(E e) {
	final ReentrantLock lock = this.lock;
	lock.lock(); // 获取写锁
	try {
		Object[] elements = getArray();
		int len = elements.length;
		Object[] newElements = Arrays.copyOf(elements, len + 1); // 基于底层数组获取副本
		newElements[len] = e;
		setArray(newElements); // 对副本写完后,再替换为底层数组
		return true;
	} finally {
		lock.unlock(); // 释放写锁
	}
}

public E remove(int index) {
	final ReentrantLock lock = this.lock;
	lock.lock(); // 获取写锁
	try {
		Object[] elements = getArray();
		int len = elements.length;
		E oldValue = get(elements, index);
		int numMoved = len - index - 1;
		// 基于底层数组副本删除,完成再替换为底层数组
		if (numMoved == 0)
			setArray(Arrays.copyOf(elements, len - 1));
		else {
			Object[] newElements = new Object[len - 1];
			System.arraycopy(elements, 0, newElements, 0, index);
			System.arraycopy(elements, index + 1, newElements, index,
							 numMoved);
			setArray(newElements);
		}
		return oldValue;
	} finally {
		lock.unlock(); // 释放写锁
	}
}

public E set(int index, E element) {
	final ReentrantLock lock = this.lock;
	lock.lock(); // 获取写锁
	try {
		Object[] elements = getArray();
		E oldValue = get(elements, index);

		if (oldValue != element) {
			int len = elements.length;
			Object[] newElements = Arrays.copyOf(elements, len); // 获取底层数组副本
			newElements[index] = element; // 对副本进行修改
			setArray(newElements); // 完成后替换为底层数组
		} else {
			// Not quite a no-op; ensures volatile write semantics
			setArray(elements);
		}
		return oldValue;
	} finally {
		lock.unlock();// 释放写锁
	}
}

public E get(int index) {
	return get(getArray(), index);
}

迭代器

      采用基于底层数组的快照,不支持写操作:remove、set、add,一个ListIterator:

private static class COWIterator<E> implements ListIterator<E> {
	/** Snapshot of the array */
	private final Object[] snapshot;
	/** Index of element to be returned by subsequent call to next.  */
	private int cursor;

	private COWIterator(Object[] elements, int initialCursor) {
		cursor = initialCursor;
		snapshot = elements;
	}

	public boolean hasNext() {
		return cursor < snapshot.length;
	}

	public boolean hasPrevious() {
		return cursor > 0;
	}

	@SuppressWarnings("unchecked")
	public E next() {
		if (! hasNext())
			throw new NoSuchElementException();
		return (E) snapshot[cursor++];
	}

	@SuppressWarnings("unchecked")
	public E previous() {
		if (! hasPrevious())
			throw new NoSuchElementException();
		return (E) snapshot[--cursor];
	}

	public int nextIndex() {
		return cursor;
	}

	public int previousIndex() {
		return cursor-1;
	}

	public void remove() {
		throw new UnsupportedOperationException();
	}

	public void set(E e) {
		throw new UnsupportedOperationException();
	}

	public void add(E e) {
		throw new UnsupportedOperationException();
	}
}

特性

      如何实现线程安全?

/** The lock protecting all mutators */
transient final ReentrantLock lock = new ReentrantLock();

/** The array, accessed only via getArray/setArray. */
private volatile transient Object[] array;

// array volatile读
final Object[] getArray() {
	return array;
}

// array volatile写
final void setArray(Object[] a) {
	array = a;
}

CopyOnWriteArrayList的线程安全体现在读与写、写与写的线程安全:

1)所有写操作add、remove、set等共用lock一把锁;

2)所有写操作如果有修改,则对array volatile写;

3)所有读操作首先进行的是array volatile读;

疑问

1)为什么中的无用setArray(elements);不能去掉?

<think>我们正在讨论非并发容器并发容器的转换方法及其原理。首先,我们需要明确非并发容器(如ArrayList、HashMap等)和并发容器(如ConcurrentHashMap、CopyOnWriteArrayList等)的设计差异。 非并发容器并发环境下需要外部同步(例如使用synchronized或ReentrantLock)来保证线程安全。而并发容器内部已经实现了线程安全的机制,可以在多线程环境下直接使用。 转换方法: 1. **非并发容器并发容器**:通过包装器或直接使用并发容器实现。 - 对于List:可以使用`Collections.synchronizedList`方法将非并发List(如ArrayList)转换为同步List,但这并不是真正的并发容器(它使用同步块)。或者直接使用`CopyOnWriteArrayList`。 - 对于Map:可以使用`Collections.synchronizedMap`将HashMap转换为同步Map,或者直接使用`ConcurrentHashMap`。 2. **并发容器转非并发容器**:通常不推荐,因为并发容器内部机制复杂,直接转换为非并发容器可能失去线程安全特性。但可以通过复制数据的方式,例如将ConcurrentHashMap的所有元素复制到一个新的HashMap中(注意:在复制过程中需要保证没有并发修改,或者使用快照方式)。 原理分析: - **非并发容器转换为同步容器(使用Collections.synchronizedXXX)**: 原理:这些包装器在容器的方法上加上synchronized同步块,使用一个全局锁(mutex)来保证线程安全。例如: ```java // Collections.synchronizedList 源码片段 public E get(int index) { synchronized (mutex) {return list.get(index);} } ``` 缺点:全局锁导致并发性能较低。 - **使用并发容器**: - `CopyOnWriteArrayList`:写操作时复制整个底层数组,读操作无锁。适合读多写少的场景。 - `ConcurrentHashMap`:在JDK1.7中采用分段锁(Segment),在JDK1.8中采用CAS+synchronized(锁单个桶)。 下面我们详细讨论转换方法和原理。 ### 一、非并发容器转换为线程安全容器 #### 1. 使用`Collections.synchronizedXXX`方法 Java提供了一组静态方法,可以将非并发容器包装成同步容器。这些方法包括: - `synchronizedList(List<T> list)` - `synchronizedMap(Map<K,V> m)` - `synchronizedSet(Set<T> s)` **原理**: - 在返回的包装器对象中,每个方法都使用一个互斥锁(mutex)进行同步。默认情况下,互斥锁是包装器对象本身(this)。 - 例如,`synchronizedList`的实现: ```java static class SynchronizedList<E> extends SynchronizedCollection<E> implements List<E> { final List<E> list; SynchronizedList(List<E> list) { super(list); this.list = list; } public E get(int index) { synchronized (mutex) { return list.get(index); } } // 其他方法类似,都加上了synchronized块 } ``` **缺点**: - 性能瓶颈:所有操作都需要获取同一把锁,高并发下竞争激烈。 - 迭代器需要外部同步:在迭代时,必须手动对容器加锁,否则可能抛出`ConcurrentModificationException`。 #### 2. 使用并发容器替代 直接使用Java并发包(`java.util.concurrent`)中的容器类: - `List` → `CopyOnWriteArrayList` - `Map` → `ConcurrentHashMap` - `Set` → `CopyOnWriteArraySet` 或 `ConcurrentHashMap.newKeySet()` - `Queue` → `ConcurrentLinkedQueue`, `ArrayBlockingQueue`等 **原理**: - **`CopyOnWriteArrayList`**:写操作(add、set、remove等)通过复制整个数组来实现,写操作在一个锁的保护下进行(保证只有一个写线程),读操作无锁。适用于读多写少的场景[^4]。 ```java // 写操作示例(简化版) public boolean add(E e) { final ReentrantLock lock = this.lock; lock.lock(); try { Object[] elements = getArray(); int len = elements.length; Object[] newElements = Arrays.copyOf(elements, len + 1); newElements[len] = e; setArray(newElements); return true; } finally { lock.unlock(); } } ``` - **`ConcurrentHashMap`(JDK1.8)**:采用数组+链表/红黑树结构,使用CAS和synchronized(锁住单个桶)来实现线程安全。put操作流程如下[^3]: 1. 计算key的hash值。 2. 如果表未初始化,则初始化。 3. 如果定位到的桶为空,则通过CAS尝试插入。 4. 如果桶不为空(有节点),则使用synchronized锁住该桶的第一个节点,然后进行链表或红黑树的插入。 5. 如果链表长度超过8,则转换为红黑树。 6. 如果总元素数量超过阈值,则扩容。 ### 二、并发容器转换为非并发容器 通常没有直接的方法,因为并发容器内部结构复杂,且设计目标就是支持并发。但可以通过以下方式: 1. **复制数据**:在并发容器上获取一个快照,然后复制到一个非并发容器中。例如: ```java Map<K, V> map = new HashMap<>(); concurrentHashMap.forEach((k, v) -> map.put(k, v)); ``` 注意:在复制过程中,如果有并发修改,可能会丢失更新。因此,最好在无并发修改时进行(如暂停写操作)。 2. **使用序列化/反序列化**:将并发容器序列化为字节流,再反序列化为非并发容器(同样要注意数据一致性)。 ### 三、设计思想对比 | 容器类型 | 线程安全实现方式 | 适用场景 | |------------------|------------------------------|------------------------------| | 同步包装容器 | 方法级synchronized(全局锁) | 低并发,简单场景 | | `CopyOnWriteArrayList` | 写时复制(复制整个数组) | 读多写少,读操作要求快速响应 | | `ConcurrentHashMap` | CAS + 桶锁(synchronized) | 高并发读写 | > **转换建议**: > - 需要线程安全且性能要求高 → 直接使用并发容器(如`ConcurrentHashMap`) > - 兼容旧代码且并发压力小 → 使用`Collections.synchronizedXXX` > - 不需要线程安全 → 直接使用非并发容器(但需确保单线程环境) ### 总结 非并发容器并发容器的转换本质上是线程安全机制的转换。转换方法包括: 1. **升级为线程安全**: - 通过包装器(`Collections.synchronizedXXX`)添加全局锁。 - 替换为并发容器(如`ConcurrentHashMap`、`CopyOnWriteArrayList`)。 2. **降级为非线程安全**:通过复制数据创建非并发容器副本。 选择哪种方式取决于具体场景: - 并发性能要求高 → 并发容器。 - 需要简单同步 → 包装器。 - 单线程使用 → 非并发容器。 --- §§相关问题§§ 1. `Collections.synchronizedList` 和 `CopyOnWriteArrayList` 在性能上有何差异? 2. `ConcurrentHashMap` 在 JDK1.7 和 JDK1.8 中的实现原理有何不同? 3. 如何选择 `ConcurrentHashMap` 和 `Hashtable`? 4. `CopyOnWriteArrayList` 的写时复制机制在哪些场景下不适用?</think>### 非并发容器并发容器的转换方法及原理 Java 容器分为非并发容器(`java.util`)和并发容器(`java.util.concurrent`)。二者转换的核心是**通过同步机制实现线程安全**或**利用并发容器替代非并发容器**。以下是转换方法原理分析: --- #### 一、非并发容器并发安全的容器 ##### 1. **外部同步包装(显式加锁)** **方法**:使用 `synchronized` 或 `ReentrantLock` 包装非并发容器的操作。 **原理**: - 通过互斥锁保证同一时刻只有一个线程操作容器。 - 示例: ```java List<String> syncList = Collections.synchronizedList(new ArrayList<>()); // 包装为同步List[^1] Map<K,V> syncMap = Collections.synchronizedMap(new HashMap<>()); ``` **源码分析**(以 `Collections.synchronizedList` 为例): ```java public boolean add(E e) { synchronized (mutex) { // 全局锁(mutex = this) return list.add(e); // 委托给原始ArrayList } } ``` **缺点**: - 全局锁导致并发性能低(所有操作串行化)[^1]。 - 迭代器需手动同步,否则可能抛出 `ConcurrentModificationException`。 ##### 2. **写时复制(Copy-On-Write)** **方法**:将非并发容器替换为 `CopyOnWriteArrayList` 或 `CopyOnWriteArraySet`。 **原理**: - **读操作**:无锁访问原数组(快照)。 - **写操作**:复制新数组修改,替换旧引用(加锁保证原子性)[^4]。 **数据结构**: ```java // CopyOnWriteArrayList 核心字段 final transient ReentrantLock lock = new ReentrantLock(); private transient volatile Object[] array; // volatile保证可见性 ``` **操作流程**: ```java public boolean add(E e) { final ReentrantLock lock = this.lock; lock.lock(); // 加锁 try { Object[] elements = getArray(); Object[] newElements = Arrays.copyOf(elements, len + 1); // 复制新数组 newElements[len] = e; setArray(newElements); // volatile写替换引用 return true; } finally { lock.unlock(); } } ``` **适用场景**:读多写少(如监听器列表)。 --- #### 二、并发容器 → 非并发容器 ##### 1. **数据迁移(快照复制)** **方法**:将并发容器的数据复制到非并发容器。 **原理**: - 利用并发容器的原子快照(如 `ConcurrentHashMap.keySet()` 或 `CopyOnWriteArrayList` 的数组)。 - 示例: ```java ConcurrentHashMap<String, Integer> concurrentMap = ...; HashMap<String, Integer> hashMap = new HashMap<>(concurrentMap); // 复制构造 ``` **注意**: - 复制过程非原子,可能丢失实时更新。 - 适用于只读场景或低一致性要求。 ##### 2. **单线程环境降级** **方法**:在确认单线程访问时直接使用并发容器。 **原理**: - 并发容器(如 `ConcurrentHashMap`)在单线程下无锁竞争开销。 - 性能并发容器接近(JDK8 优化了 `ConcurrentHashMap` 的内存布局)。 --- #### 三、并发容器替代方案(推荐) 直接使用并发容器替代非并发容器,无需转换: | 非并发容器 | 并发容器替代品 | 实现原理 | |----------------|---------------------------|-----------------------------| | `ArrayList` | `CopyOnWriteArrayList` | 写时复制 + ReentrantLock | | `HashMap` | `ConcurrentHashMap` | CAS + synchronized 桶锁[^3] | | `HashSet` | `ConcurrentHashMap.KeySet` | 委托给ConcurrentHashMap | | `LinkedList` | `ConcurrentLinkedQueue` | CAS 无锁队列 | ##### `ConcurrentHashMap` 原理(JDK8)[^3] **数据结构**: - 数组 + 链表/红黑树(同 `HashMap`)。 **线程安全机制**: - **CAS**:初始化数组、插入空桶等。 - **synchronized**:锁定哈希冲突的桶(链表头节点)。 **put 流程**: 1. 计算哈希,定位桶位置。 2. 桶为空 → CAS 插入。 3. 桶非空 → `synchronized` 锁住头节点: - 链表 → 遍历插入/更新 - 红黑树 → 树节点插入 4. 链表长度 ≥ 8 → 树化。 --- ### 设计思想对比 | **方案** | **原理** | **性能** | **适用场景** | |--------------------|------------------------------|---------------|---------------------| | 外部同步包装 | 全局锁(synchronized) | 低并发 | 简单同步需求 | | 写时复制 | 读无锁 + 写复制数组 | 读极高,写极低 | 读多写少(如配置) | | `ConcurrentHashMap`| CAS + 桶级锁 | 高并发 | 高频读写键值对 | | 数据迁移 | 原子快照复制 | 一次性开销 | 只读数据导出 | --- ### 关键问题解答 #### 1. 为什么推荐直接使用并发容器? - **安全**:内置线程安全机制,避免手动同步错误。 - **性能**:并发容器优化了锁粒度(如 `ConcurrentHashMap` 的桶锁)。 - **功能**:提供原子方法(如 `ConcurrentHashMap.putIfAbsent()`)。 #### 2. 如何选择转换方案? - 需要兼容旧代码 → 外部同步包装。 - 高频读、低频写 → `CopyOnWriteArrayList`。 - 高频读写 → `ConcurrentHashMap`。 - 数据归档 → 快照复制到非并发容器。 > **最佳实践**: > - 新项目优先使用 `java.util.concurrent` 容器。 > - 转换时测试并发场景下的性能和数据一致性。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值