经典面试题: 为啥 ConcurrentHashMap 读操作不需要加锁?

本文深入探讨了ConcurrentHashMap在Java 1.8中如何通过Node元素的volatile修饰符和数组的volatile属性实现无锁get操作,确保了并发安全性和数据一致性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

点击上方“俊林”,马上关注,每天早上8:50准时推送

真爱,请置顶或星标


640?wx_fmt=png

http://tinyurl.com/y685vvv9

目录

  • ConcurrentHashMap的简介

  • get操作源码

  • volatile登场

  • 是加在数组上的volatile吗?

  • 用volatile修饰的Node

  • 总结


我们知道,ConcurrentHashmap(1.8)这个并发集合框架是线程安全的,当你看到源码的get操作时,会发现get操作全程是没有加任何锁的,这也是这篇博文讨论的问题——为什么它不需要加锁呢?

ConcurrentHashMap的简介

我想有基础的同学知道在jdk1.7中是采用Segment + HashEntry + ReentrantLock的方式进行实现的,而1.8中放弃了Segment臃肿的设计,取而代之的是采用Node + CAS + Synchronized来保证并发安全进行实现。

  • JDK1.8的实现降低锁的粒度,JDK1.7版本锁的粒度是基于Segment的,包含多个HashEntry,而JDK1.8锁的粒度就是HashEntry(首节点)

  • JDK1.8版本的数据结构变得更加简单,使得操作也更加清晰流畅,因为已经使用synchronized来进行同步,所以不需要分段锁的概念,也就不需要Segment这种数据结构了,由于粒度的降低,实现的复杂度也增加了

  • JDK1.8使用红黑树来优化链表,基于长度很长的链表的遍历是一个很漫长的过程,而红黑树的遍历效率是很快的,代替一定阈值的链表,这样形成一个最佳拍档

640?wx_fmt=png

get操作源码

  • 首先计算hash值,定位到该table索引位置,如果是首节点符合就返回

  • 如果遇到扩容的时候,会调用标志正在扩容节点ForwardingNode的find方法,查找该节点,匹配就返回

  • 以上都不符合的话,就往下遍历节点,匹配就返回,否则最后就返回null

//会发现源码中没有一处加了锁	
public V get(Object key) {	
    Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;	
    int h = spread(key.hashCode()); //计算hash	
    if ((tab = table) != null && (n = tab.length) > 0 &&	
        (e = tabAt(tab, (n - 1) & h)) != null) {//读取首节点的Node元素	
        if ((eh = e.hash) == h) { //如果该节点就是首节点就返回	
            if ((ek = e.key) == key || (ek != null && key.equals(ek)))	
                return e.val;	
        }	
        //hash值为负值表示正在扩容,这个时候查的是ForwardingNode的find方法来定位到nextTable来	
        //eh=-1,说明该节点是一个ForwardingNode,正在迁移,此时调用ForwardingNode的find方法去nextTable里找。	
        //eh=-2,说明该节点是一个TreeBin,此时调用TreeBin的find方法遍历红黑树,由于红黑树有可能正在旋转变色,所以find里会有读写锁。	
        //eh>=0,说明该节点下挂的是一个链表,直接遍历该链表即可。	
        else if (eh < 0)	
            return (p = e.find(h, key)) != null ? p.val : null;	
        while ((e = e.next) != null) {//既不是首节点也不是ForwardingNode,那就往下遍历	
            if (e.hash == h &&	
                ((ek = e.key) == key || (ek != null && key.equals(ek))))	
                return e.val;	
        }	
    }	
    return null;	
}

get没有加锁的话,ConcurrentHashMap是如何保证读到的数据不是脏数据的呢?

volatile登场

对于可见性,Java提供了volatile关键字来保证可见性、有序性。但不保证原子性。

普通的共享变量不能保证可见性,因为普通共享变量被修改之后,什么时候被写入主存是不确定的,当其他线程去读取时,此时内存中可能还是原来的旧值,因此无法保证可见性。

  • volatile关键字对于基本类型的修改可以在随后对多个线程的读保持一致,但是对于引用类型如数组,实体bean,仅仅保证引用的可见性,但并不保证引用内容的可见性。。

  • 禁止进行指令重排序。

背景:为了提高处理速度,处理器不直接和内存进行通信,而是先将系统内存的数据读到内部缓存(L1,L2或其他)后再进行操作,但操作完不知道何时会写到内存。

  • 如果对声明了volatile的变量进行写操作,JVM就会向处理器发送一条指令,将这个变量所在缓存行的数据写回到系统内存。但是,就算写回到内存,如果其他处理器缓存的值还是旧的,再执行计算操作就会有问题。

  • 在多处理器下,为了保证各个处理器的缓存是一致的,就会实现缓存一致性协议,当某个CPU在写数据时,如果发现操作的变量是共享变量,则会通知其他CPU告知该变量的缓存行是无效的,因此其他CPU在读取该变量时,发现其无效会重新从主存中加载数据。

640?wx_fmt=jpeg

总结下来:

第一:使用volatile关键字会强制将修改的值立即写入主存;

第二:使用volatile关键字的话,当线程2进行修改时,会导致线程1的工作内存中缓存变量的缓存行无效(反映到硬件层的话,就是CPU的L1或者L2缓存中对应的缓存行无效);

第三:由于线程1的工作内存中缓存变量的缓存行无效,所以线程1再次读取变量的值时会去主存读取。

是加在数组上的volatile吗?

/**	
     * The array of bins. Lazily initialized upon first insertion.	
     * Size is always a power of two. Accessed directly by iterators.	
     */	
    transient volatile Node<K,V>[] table;

我们知道volatile可以修饰数组的,只是意思和它表面上看起来的样子不同。举个栗子,volatile int array[10]是指array的地址是volatile的而不是数组元素的值是volatile的.

用volatile修饰的Node

get操作可以无锁是由于Node的元素val和指针next是用volatile修饰的,在多线程环境下线程A修改结点的val或者新增节点的时候是对线程B可见的。

static class Node<K,V> implements Map.Entry<K,V> {	
    final int hash;	
    final K key;	
    //可以看到这些都用了volatile修饰	
    volatile V val;	
    volatile Node<K,V> next;	
    Node(int hash, K key, V val, Node<K,V> next) {	
        this.hash = hash;	
        this.key = key;	
        this.val = val;	
        this.next = next;	
    }	
    public final K getKey()       { return key; }	
    public final V getValue()     { return val; }	
    public final int hashCode()   { return key.hashCode() ^ val.hashCode(); }	
    public final String toString(){ return key + "=" + val; }	
    public final V setValue(V value) {	
        throw new UnsupportedOperationException();	
    }	
    public final boolean equals(Object o) {	
        Object k, v, u; Map.Entry<?,?> e;	
        return ((o instanceof Map.Entry) &&	
                (k = (e = (Map.Entry<?,?>)o).getKey()) != null &&	
                (v = e.getValue()) != null &&	
                (k == key || k.equals(key)) &&	
                (v == (u = val) || v.equals(u)));	
    }	
    /**	
     * Virtualized support for map.get(); overridden in subclasses.	
     */	
    Node<K,V> find(int h, Object k) {	
        Node<K,V> e = this;	
        if (k != null) {	
            do {	
                K ek;	
                if (e.hash == h &&	
                    ((ek = e.key) == k || (ek != null && k.equals(ek))))	
                    return e;	
            } while ((e = e.next) != null);	
        }	
        return null;	
    }	
}

既然volatile修饰数组对get操作没有效果那加在数组上的volatile的目的是什么呢?

其实就是为了使得Node数组在扩容的时候对其他线程具有可见性而加的volatile

总结

  • 在1.8中ConcurrentHashMap的get操作全程不需要加锁,这也是它比其他并发集合比如hashtable、用Collections.synchronizedMap()包装的hashmap;安全效率高的原因之一。

  • get操作全程不需要加锁是因为Node的成员val是用volatile修饰的和数组用volatile修饰没有关系。

  • 数组用volatile修饰主要是保证在数组扩容的时候保证可见性。


说句题外话,有不少人想加鱼哥微信,鱼哥姑且放出来,但是坑位有限哦
640?wx_fmt=png 想去大厂么? 来加入鱼哥技术星球,放大你进大厂概率 扫描如下二维码加入我的知识星球: 640?wx_fmt=png  推荐阅读 憋了1年,今天,我有件大事和大家说下! "2019,别去互联网大厂了!" 640?wx_fmt=png 喜欢就点个在看吧
### Java 中 ConcurrentHashMap 实现线程安全的底层原理 #### 什么是 ConcurrentHashMap? `ConcurrentHashMap` 是一种支持高并发场景下的线程安全 Map 结构,它允许多个线程同时对其进行操作会发生数据一致的问题[^2]。相比传统的 `Hashtable` 和带有 `synchronized` 锁的 `HashMap`,`ConcurrentHashMap` 提供了更高的吞吐量和更低的竞争开销。 --- #### ConcurrentHashMap 的核心设计思想 为了提高性能,`ConcurrentHashMap` 并没有像 `Hashtable` 或者 `Collections.synchronizedMap()` 那样对整个表加锁,而是采用了更细粒度的锁分离策略——**分段锁(Segment Lock)**。具体来说: - 在 JDK 7 中,`ConcurrentHashMap` 将内部的数据分为若干个 Segment 对象,每个 Segment 类似于一个小的 HashTable,并且有自己的锁。这样可以使得同的线程可以在同的 Segment 上进行操作互相干扰。 - 在 JDK 8 中,`ConcurrentHashMap` 改进了其底层结构,去掉了 Segment 的概念,转而使用了一种更加高效的实现方式:**数组 + 链表 + 红黑树**[^1]。 --- #### JDK 8 中 ConcurrentHashMap 的底层实现细节 ##### 数据结构概述 在 JDK 8 中,`ConcurrentHashMap` 的底层由以下几个部分组成: 1. **Node 数组**:类似于普通的 HashMap,`ConcurrentHashMap` 使用了一个 Node 数组作为主要存储容器。 2. **链表**:当哈希冲突时,节点会被链接成一条单向链表。 3. **红黑树**:如果链表长度超过一定阈值(默认为 8),则会将链表转换为红黑树以减少查找的时间复杂度[^1]。 ##### 关键特性 1. **CAS 操作**:`ConcurrentHashMap` 大量依赖于无锁算法中的 CAS(Compare And Swap)技术来进行高效的状态更新。例如,在插入新元素时,先尝试通过 CAS 更新指定位置上的引用;只有当 CAS 失败时才会考虑升级到更高层次的同步手段。 2. **分段锁机制**:虽然 JDK 8 移除了显式的 Segments,但实际上仍然保留了类似的思路。对于每一次修改操作(如 put、remove),只会针对涉及的具体桶位施加重入锁(ReentrantLock),而不是全局锁定整个表[^2]。 3. **帮助式传播(Helpful Propagation)**:为了避免长时间持有锁带来的性能瓶颈,`ConcurrentHashMap` 设计了一些辅助函数让其他线程也能参与到一些耗时任务当中,比如扩容过程中的迁移工作就可以被任何发现正在进行 resize 的线程主动接手完成一部分[^1]。 --- #### 如何保证线程安全性? 1. **操作无需加锁** - 由于引入了 JMM (Java Memory Model)的支持,`ConcurrentHashMap` 能够确保即使是在多线程环境下,简单的 get 请求也可以安全地返回最新版本的结果,而需要额外付出同步成本[^3]。 2. **写操作局部化保护** - 插入或删除等变更型 API 主要集中在特定索引处执行,因此只需对该区域实施短暂封锁即可满足需求。例如,在调用 `putVal(K,V)` 方法期间,仅需占有对应槽位所属的 ReentrantLock 实例便可顺利推进后续逻辑[^2]。 3. **动态调整容量大小** - 当现有空间足以容纳新增项时,`ConcurrentHashMap` 会自动触发扩展流程。值得注意的是,这一阶段同样遵循最小影响原则,即尽量影响正常运转的服务请求。此外,得益于前面提到的帮助式传播理念,即便原作者暂时离开现场,后来者依旧有机会接力承担起剩余职责直至彻底结束整个重构周期。 --- #### 示例代码分析 以下是一个简化版的 `putIfAbsent` 方法演示如何利用 CAS 来保障原子性和一致性: ```java final V putVal(int hash, K key, V value) { Node<K,V>[] tab; Node<K,V> p; int n, i; if ((tab = table) != null && (n = tab.length) > 0) { // 计算定位索引 if ((p = tab[i = (n - 1) & hash]) == null) casTabAt(tab, i, null, new Node<K,V>(hash, key, value)); // 使用 CAS 创建首节点 else { lockForPut(p); // 加锁后再继续深入判断 try { Object k; if (valueMatch(p.value)) // 已存在相同key,则跳过赋值 return p.value; else // 新增情况走常规路径 addBinTreeOrList(hash, key, value); } finally { unlock(); // 管怎样都要记得解锁哦~ } } } return null; } ``` --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值