ConcurrentHashMap
是 Java 中支持高并发、高吞吐量的线程安全的哈希表实现。与 Hashtable
和同步的 HashMap
(Collections.synchronizedMap(new HashMap<...>())
) 相比,ConcurrentHashMap
在多线程环境下提供了更好的读写性能。
ConcurrentHashMap 的工作原理
ConcurrentHashMap
在内部使用分段锁(Segmentation)的概念来管理对哈希表的并发访问。每个段(Segment)本质上是一个独立的 HashMap
,它有自己的锁。只要多个线程访问不同的段,它们可以同时进行处理,而不会彼此干扰。
ConcurrentHashMap 的关键特性
- 锁分段(Segmentation):
ConcurrentHashMap
将数据分为一段一段,每个段独立加锁。 - 不锁整张表: 读操作几乎完全不锁,写操作锁定小的数据区域。
- 弱一致性迭代器: 迭代器反映的是创建迭代器时或迭代器创建后的某个时间点的表状态。
ConcurrentHashMap 的源码分析(简化版)
以下是 ConcurrentHashMap
的一个简化版的源码分析,实际的实现要比这个复杂得多,因为它还包括了对并发操作的细化控制和优化:
public class ConcurrentHashMap<K,V> extends AbstractMap<K,V> implements ConcurrentMap<K,V>, Serializable {
// ConcurrentHashMap 中存储数据的核心数组。
// 为了简化示例,我们跳过具体的 Segment 类实现。
private final Segment<K,V>[] segments;
private static final class Segment<K,V> extends ReentrantLock {
// 实际存储数据的哈希桶数组
transient volatile HashEntry<K,V>[] table;
}
// 基本的 HashEntry 节点结构,用于存储键值对
static final class HashEntry<K,V> {
final K key;
final int hash;
volatile V value;
final HashEntry<K,V> next;
HashEntry(K key, int hash, HashEntry<K,V> next, V value) {
this.key = key;
this.hash = hash;
this.next = next;
this.value = value;
}
}
// 省略了构造函数和一些方法
public V get(Object key) {
int hash = hash(key.hashCode()); // 计算哈希值
return segmentFor(hash).get(key, hash); // 定位到具体的 Segment 并获取值
}
public V put(K key, V value) {
int hash = hash(key.hashCode());
return segmentFor(hash).put(key, hash, value, false);
}
// 其他方法如 remove, clear 等同样定位到 Segment 然后进行操作
// 内部工具方法,用于定位给定哈希值的 Segment
private Segment<K,V> segmentFor(int hash) {
return segments[(hash >>> segmentShift) & segmentMask];
}
// 哈希函数,根据 key 的 hashCode() 计算一个分布均匀的哈希值
private static int hash(int h) {
// 高位参与运算,防止在桶数组长度较小的情况下冲突过多
h ^= (h >>> 20) ^ (h >>> 12);
return h ^ (h >>> 7) ^ (h >>> 4);
}
// 省略了 Segment 的具体实现和其他方法...
}
示例代码
由于 ConcurrentHashMap
的实际实现远比上面的示例复杂,这里不适合展示完整的源代码。但是我们可以提供一个使用 ConcurrentHashMap
的简单示例:
import java.util.concurrent.*;
public class ConcurrentHashMapExample {
public static void main(String[] args) {
ConcurrentHashMap<String, Integer> map = new ConcurrentHashMap<>();
// 多线程环境下执行并发写入
ExecutorService executor = Executors.newFixedThreadPool(2);
executor.submit(() -> map.put("key1", 1));
executor.submit(() -> map.put("key2", 2));
try {
executor.awaitTermination(1, TimeUnit.SECONDS);
} catch (InterruptedException e) {
e.printStackTrace();
}
// 多线程环境下执行并发读取
executor.submit(() -> {
Integer value = map.get("key1");
System.out.println("Value for key1: " + value);
});
executor.submit(() -> {
Integer value = map.get("key2");
System.out.println("Value for key2: " + value);
});
executor.shutdown();
}
}
在并发程序中使用 ConcurrentHashMap
可以显著提高共享哈希表的并发性能,同时降低风险。设计时的注意点是要确保足够的段数(默认情况下,根据并发级别来确定),以减少线程竞争。
注意: 在更高版本的 Java 中(例如 Java 8 及之后的版本),ConcurrentHashMap
的实现已经发生了改变,使用了完全不同的技术(例如:使用 synchronized
和 volatile
,废弃了 Segment 的概念),但是核心理念和目标保持不变:在保持线程安全的同时,尽可能地提升并发性能。