ConcurrentHashMap

本文详细解析了ConcurrentHashMap在JDK1.7和JDK1.8中的实现原理,包括锁分段策略、数据结构变化、线程安全机制、源码分析等内容,对比了不同版本之间的差异。

一、顶部注释分析

1.1 数据结构

1.1.1 JDK1.7实现
  • 在 JDK1.7中,ConcurrentHashMap 通过**“锁分段”**来实现线程安全
  • 通过将哈希表分成许多片段 (segments) ,每一个片段 (table) 都类似于 HashMap,有一个HashEntry 数组,数组的每项又是 HashEntry 组成的链表
  • Segment 继承了ReentrantLock,所以 Segment 本质上是一个可重入的互斥锁
  • 在访问某个键值对时,需要先获取该键值对所在的 segment 上的锁,获取锁后,其他线程就不能访问此segment了,但可以访问其他的segment,从而避免了把整个哈希表都锁住

1.1.2 JDK1.8实现
  • JDK1.8中放弃了锁分段的方式,结构和 HashMap 相同,也是数组+链表+红黑树的方式
  • 但是通过 CAS 和部分加锁的方式来实现线程安全

1.2 从注释中得到的结论

  • A hash table supporting full concurrency of retrievals and high expected concurrency for updates:ConcurrentHashMap 是一个支持高并发检索和更新的哈希表
  • ConcurrentHashMap 是线程安全的,但不是靠阻塞和封锁整个哈希表来实现的
  • get 操作不是阻塞的,因此可以和一些更新操作并行,如 put 和 remove
  • 一些和统计相关的方法,如 size、isEmpty、containsValue 最好在单线程环境下使用,在多线程环境下只能反应一个暂时的状态,可用于估计或监视,但可能无法返回准确值,除非此时没有发生并发的修改
  • 当散列碰撞过多时,ConcurrentHashMap 会动态增长。但是扩容非常消耗资源,因此最好提前估计好容量
  • ConcurrentHashMap 不允许 key 或 value 为 null

二、源码分析

2.1 定义

public class ConcurrentHashMap<K,V> extends AbstractMap<K,V> 
		implements ConcurrentMap<K,V>, Serializable
  • ConcurrentHashMap<K,V>:HashMap 是以 key-value 形式存储数据的
  • extends AbstractMap<K,V>:继承自 AbstractMap,大大减少了实现 Map 接口时需要的工作量
  • implements ConcurrentMap<K,V>:实现了 ConcurrentMap 接口,一个提供线程安全性和原子性保证的 Map
  • implements Serializable:可以序列化

2.2 字段

// 哈希表数组,用volatile修饰,大小总是为2的整数次幂
transient volatile Node<K,V>[] table;

// 基础计数器,通过CAS来更新
 private transient volatile long baseCount;
 
/** 
 * 用于控制初始化和扩容
 * 当为负数时,表示正在进行初始化或扩容操作:
 *    -1 表示正在初始化
 *    -N 表示有N-1个线程正在进行扩容操作
 * 
 * 默认值为0
 * 当初始化之后,保存下一次的扩容值
 */
private transient volatile int sizeCtl;

// 用于计算size
private transient volatile CounterCell[] counterCells

2.3 Node静态内部类

  • 与 HashMap 中的 Node 相似,但有如下区别:
    1. 对 value 和 next 属性设置了 volatile 同步锁;
    2. 不允许调用 setValue 方法直接改变 Node 的 value,否则会抛出异常
    3. 增加了 find 方法用于辅助 get 方法
static class Node<K,V> implements Map.Entry<K,V> 
{
	final int hash;
	final K key;
	volatile V val;
	volatile Node<K,V> next;

	Node(int hash, K key, V val, Node<K,V> next) 
	{
		this.hash = hash;
		this.key = key;
		this.val = val;
		this.next = next;
	}
	
	public final V setValue(V value) 
	{
		throw new UnsupportedOperationException();
	}
	
	Node<K,V> find(int h, Object k) 
	{
    	Node<K,V> e = this;
    	if (k != null) {
			do {
   				K ek;
    			if (e.hash == h && 
    				((ek = e.key) == k || (ek != null && k.equals(ek))))
					return e;
			} while ((e = e.next) != null);
    	}
    	return null;
	}
}

2.4 构造方法

  1. public ConcurrentHashMap():构建一个空ConcurrentHashMap,默认容量为16
  2. public ConcurrentHashMap(int initialCapacity):构建一个空ConcurrentHashMap并根据参数设置下次扩容值
  3. public ConcurrentHashMap(Map<? extends K, ? extends V> m):根据给定的 Map 进行构建
  4. public ConcurrentHashMap(int initialCapacity, float loadFactor):根据给定的参数设置下次扩容值和加载因子,默认并行度为1
  5. public ConcurrentHashMap(int initialCapacity, float loadFactor, int concurrencyLevel):根据给定的参数设置下次扩容值和加载因子,且容量至少为估计的线程数 concurrencyLevel

2.5 put 操作

2.5.1 put 方法大致步骤
  1. 计算 key 的哈希值;
  2. 如果 table 数组为空,则先进行初始化 (2.5.2节);
  3. 根据 hash 值计算出 key 在表中所处的位置,即 (n - 1) & hash
  • 如果该位置没有值 ,则直接放入,且不需要加锁
  • 如果插入位置是连接点,说明正在进行扩容,则帮助当前线程扩容
  • 否则加锁,然后根据链表或树结构遍历查找 key 值,找到则进行更新,否则新增节点插入;
  1. 与 HashMap 类似,若链表长度超过阈值,则转为红黑树;
  2. 如果操作3中执行的是替换操作,返回被替换的value;
  3. 否则说明节点是被新插入的,因此将元素数量加1

整个过程中只有3中的第三步需要加锁,从而提高并行性能

2.5.2 初始化 table 数组
  • 调用 ConcurrentHashMap 的构造方法仅仅只是设置了一些参数,而整个 table 的初始化是在向其中插入元素的时候发生的,例如 put 方法
  • 初始化方法主要应用了关键属性 sizeCtl,如果 sizeCtl < 0,表示其他线程正在进行初始化,就放弃操作,从而保证只让一个线程对 table 进行初始化
  • 如果获得了初始化权限,就先用 CAS 方法将 sizeCtl 置为-1,防止后续其他线程进入
  • 初始化完成后,将 sizeCtl 的值设为n - (n >>> 2)),即 0.75 × n
private final Node<K,V>[] initTable() 
{
	Node<K,V>[] tab; int sc;
	while ((tab = table) == null || tab.length == 0) 
    {
		// 其他线程正在进行初始化
        if ((sc = sizeCtl) < 0)
			Thread.yield(); // lost initialization race; just spin
		else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) 
        {
			try 
            {
				if ((tab = table) == null || tab.length == 0) 
                {
					int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
					@SuppressWarnings("unchecked")
					Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
					table = tab = nt;
					sc = n - (n >>> 2); // 0.75 × n
				}	
			} 
            finally 
            {
				sizeCtl = sc;
			}
			break;
		}
	}
	return tab;
}

2.6 get 操作

  • get 方法没有进行加锁,其大致步骤为:
    1. 计算 key 的哈希值;
    2. 根据哈希值查找节点位置;
    3. 如果节点直接在桶的头节点上,则直接返回;
    4. 否则说明有碰撞,根据树形结构或链表结构使用不同的方法继续查找;
    5. 如果找到则返回对应值,否则返回 null
// 从源码中可以看出,get方法没有加锁

public V get(Object key) 
{
	Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;
	int h = spread(key.hashCode());
	if ((tab = table) != null && (n = tab.length) > 0 &&
		(e = tabAt(tab, (n - 1) & h)) != null) 
    {
		if ((eh = e.hash) == h) 
        {
			if ((ek = e.key) == key || (ek != null && key.equals(ek)))
			return e.val;
		}
		else if (eh < 0)
			return (p = e.find(h, key)) != null ? p.val : null;
		while ((e = e.next) != null) 
        {
			if (e.hash == h &&
				((ek = e.key) == key || (ek != null && key.equals(ek))))
				return e.val;
		}
	}
	return null;
}
### ConcurrentHashMap 使用指南 ConcurrentHashMap 是 Java 提供的一种线程安全的 Map 实现,专为高并发环境设计。相比传统的 HashMap 和 Hashtable,它在多线程访问时表现出更高的性能和安全性。通过分段锁机制与 CAS(Compare and Swap)操作,ConcurrentHashMap 能够支持多个线程同时读写而无需全局加锁。 #### 线程安全特性 ConcurrentHashMap 的线程安全特性来源于其内部实现机制。不同于 Hashtable 使用的 synchronized 方法进行全局加锁,ConcurrentHashMap 在 JDK 1.7 及之前版本中采用 **分段锁(Segment Locking)** 技术[^3]。每个 Segment 相当于一个独立的 HashTable,允许多个线程同时访问不同的 Segment,从而减少锁竞争,提高并发性能。 在 JDK 1.8 中,ConcurrentHashMap 进一步优化了其实现,使用 **桶锁(Bucket-level Locking)** 和 **红黑树结构** 来提升性能。此时,锁的粒度更细,仅对当前操作的桶进行加锁,进一步提高了并发能力[^5]。 #### 常用方法与并发操作 ConcurrentHashMap 提供了一系列线程安全的操作方法,例如: - `putIfAbsent(K key, V value)`:只有当指定键不存在或映射值为 null 时才插入键值对。 - `computeIfPresent(K key, BiFunction<? super K, ? super V, ? extends V> remappingFunction)`:如果键存在,则根据提供的函数重新计算该键的值。 - `compute(K key, BiFunction<? super K, ? super V, ? extends V> remappingFunction)`:无论键是否存在,都尝试重新计算其映射值。 - `forEach(BiConsumer<? super K, ? super V> action)`:对每个键值对执行指定操作。 这些方法可以在不使用外部同步的情况下安全地用于多线程环境中[^2]。 #### 示例代码 以下是一个简单的示例,展示如何在 Spring Boot 应用中使用 ConcurrentHashMap 管理共享数据: ```java import java.util.concurrent.ConcurrentHashMap; public class UserService { private final ConcurrentHashMap<String, Integer> userCountMap = new ConcurrentHashMap<>(); public void incrementUserCount(String department) { userCountMap.compute(department, (key, oldValue) -> (oldValue == null) ? 1 : oldValue + 1); } public int getUserCount(String department) { return userCountMap.getOrDefault(department, 0); } } ``` 上述代码中的 `compute` 方法确保在多线程环境下对用户计数的更新是线程安全的,无需额外的同步控制[^4]。 #### 适用场景 ConcurrentHashMap 非常适合以下场景: - **缓存系统**:如 Web 应用中缓存用户信息、会话状态等。 - **计数器**:统计在线人数、请求次数等。 - **任务调度**:管理待处理任务队列或资源池。 - **配置中心**:存储可动态更新的配置项。 由于其良好的并发性能,ConcurrentHashMap 成为了构建高性能服务端应用的重要组件之一。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值