Java--HashMap 在高并发下引起的死循环

本文深入探讨了HashMap的基本实现原理,包括其内部结构、碰撞处理机制、扩容及rehash过程,并特别关注了多线程环境下可能产生的问题及其解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

HashMap 基本实现(JDK 8 之前)

HashMap 通常会用一个指针数组(假设为 table[])来做分散所有的 key,当一个 key 被加入时,会通过 Hash 算法通过 key 算出这个数组的下标 i,然后就把这个 插到 table[i] 中,如果有两个不同的 key 被算在了同一个 i,那么就叫冲突,又叫碰撞,这样会在 table[i] 上形成一个链表

 

如果 table[] 的尺寸很小,比如只有 2 个,如果要放进 10 个 keys 的话,那么碰撞非常频繁,于是一个 O(1) 的查找算法,就变成了链表遍历,性能变成了 O(n),这是 Hash 表的缺陷

所以,Hash 表的尺寸和容量非常的重要。一般来说,Hash 表这个容器当有数据要插入时,都会检查容量有没有超过设定的 threshold,如果超过,需要增大 Hash 表的尺寸,但是这样一来,整个 Hash 表里的元素都需要被重算一遍。这叫 rehash,这个成本相当的大

HashMap 的 rehash 源代码

Put 一个 Key, Value 对到 Hash 表中:

public V put(K key, V value) {
    ......
    // 计算 Hash 值
    int hash = hash(key.hashCode());
    int i = indexFor(hash, table.length);
    // 如果该 key 已被插入,则替换掉旧的 value(链接操作)
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {
        Object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }
    modCount++;
    // 该 key 不存在,需要增加一个结点
    addEntry(hash, key, value, i);
    return null;
}

检查容量是否超标

void addEntry(int hash, K key, V value, int bucketIndex) {
    Entry<K,V> e = table[bucketIndex];
    table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
    //查看当前的 size 是否超过了设定的阈值 threshold,如果超过,需要 resize
    if (size++ >= threshold)
        resize(2 * table.length);
}

新建一个更大尺寸的 hash 表,然后把数据从老的 Hash 表中迁移到新的 Hash 表中

void resize(int newCapacity) {
    Entry[] oldTable = table;
    int oldCapacity = oldTable.length;
    ......
    // 创建一个新的 Hash Table
    Entry[] newTable = new Entry[newCapacity];
    // 将 Old Hash Table 上的数据迁移到 New Hash Table 上
    transfer(newTable);
    table = newTable;
    threshold = (int)(newCapacity * loadFactor);
}

迁移的源代码

void transfer(Entry[] newTable) {
    Entry[] src = table;
    int newCapacity = newTable.length;
    //下面这段代码的意思是:
    //  从OldTable里摘一个元素出来,然后放到NewTable中
    for (int j = 0; j < src.length; j++) {
        Entry<K,V> e = src[j];
        if (e != null) {
            src[j] = null;
            do {
                Entry<K,V> next = e.next;
                int i = indexFor(e.hash, newCapacity);
                e.next = newTable[i];
                newTable[i] = e;
                e = next;
            } while (e != null);
        }
    }
}

该方法实现的机制就是将每个链表转化到新链表,并且链表中的位置发生反转,而这在多线程情况下是很容易造成链表回路,从而发生 get() 死循环。所以只要保证建新链时还是按照原来的顺序的话就不会产生循环(JDK 8 的改进)

正常的 ReHash 的过程

  • 假设我们的 hash 算法就是简单的用 key mod 一下表的大小(也就是数组的长度)
  • 最上面的是 old hash 表,其中的 Hash 表的 size = 2,所以 key = 3, 7, 5,在 mod 2 以后都冲突在 table[1] 这里了
  • 接下来的三个步骤是 Hash 表 resize 成 4,然后所有的 重新 rehash 的过程

 

并发下的 Rehash

1)假设有两个线程

do {
    Entry<K,V> next = e.next; //  假设线程一执行到这里就被调度挂起了
    int i = indexFor(e.hash, newCapacity);
    e.next = newTable[i];
    newTable[i] = e;
    e = next;
} while (e != null);

而线程二执行完成了。于是有下面的这个样子

注意,因为 Thread1 的 e 指向了 key(3),而 next 指向了 key(7),其在线程二 rehash 后,指向了线程二重组后的链表。可以看到链表的顺序被反转

2)线程一被调度回来执行

  • 先是执行 newTalbe[i] = e;
  • 然后是 e = next,导致了 e 指向了 key(7)
  • 而下一次循环的 next = e.next 导致了 next 指向了 key(3)

 

3)线程一接着工作。把 key(7) 摘下来,放到 newTable[i] 的第一个,然后把 e 和 next 往下移

4)环形链接出现
e.next = newTable[i] 导致 key(3).next 指向了 key(7)
此时的 key(7).next 已经指向了 key(3), 环形链表就这样出现了

JDK 8 的改进

JDK 8 中采用的是位桶 + 链表/红黑树的方式,当某个位桶的链表的长度超过 8 的时候,这个链表就将转换成红黑树

HashMap 不会因为多线程 put 导致死循环(JDK 8 用 head 和 tail 来保证链表的顺序和之前一样;JDK 7 rehash 会倒置链表元素),但是还会有数据丢失等弊端(并发本身的问题)。因此多线程情况下还是建议使用 ConcurrentHashMap

为什么线程不安全

HashMap 在并发时可能出现的问题主要是两方面:

  • 如果多个线程同时使用 put 方法添加元素,而且假设正好存在两个 put 的 key 发生了碰撞(根据 hash 值计算的 bucket 一样),那么根据 HashMap 的实现,这两个 key 会添加到数组的同一个位置,这样最终就会发生其中一个线程 put 的数据被覆盖

  • 如果多个线程同时检测到元素个数超过数组大小 * loadFactor,这样就会发生多个线程同时对 Node 数组进行扩容,都在重新计算元素位置以及复制数据,但是最终只有一个线程扩容后的数组会赋给 table,也就是说其他线程的都会丢失,并且各自线程 put 的数据也丢失

<think>好的,我现在需要解决JavaHashMap因头插法导致死循环问题。首先,我得回忆一下HashMap的工作原理。在Java 8之前,HashMap在处理哈希冲突时使用的是链表,当多个键值对映射到同一个桶时,会以链表形式存储。当链表过长时,会进行扩容,也就是重新调整大小,这个过程叫做rehashing。 用户提到的问题是关于头插法导致死循环的情况。头插法意味着在插入新节点时,会将新节点放在链表的头部而不是尾部。在扩容时,旧链表中的元素会被重新计算哈希值,然后放入新的桶中。这个时候,如果多线程同时进行扩容操作,可能会导致链表形成环形结构,进而导致死循环。这种情况通常发生在多线程环境下,比如多个线程同时执行put操作并触发扩容。 我记得在Java 8中,HashMap的实现已经改为了尾插法,也就是在插入链表时,新节点被放在链表的末尾。这样可以避免在扩容时出现环形链表的情况,从而解决了多线程下的死循环问题。因此,一个直接的解决方案是升级到Java 8或更高版本,利用新的HashMap实现。 但是,如果用户因为某些原因必须使用旧版本的Java,比如Java 7或更早,这时候该怎么办呢?可能需要考虑其他的解决方案。比如,使用线程安全的ConcurrentHashMap来代替HashMap。ConcurrentHashMap内部使用了分段锁等机制来保证线程安全,避免了多线程操作时的竞争问题。 另外,用户可能需要意识到,即使使用了尾插法,HashMap本身也不是线程安全的。在多线程环境下,即使没有死循环问题,仍然可能出现数据不一致或其他并发问题。因此,正确的做法是使用线程安全的集合类,如ConcurrentHashMap,或者通过外部同步机制来保证线程安全。 再查一下相关的资料,比如引用中的内容,虽然引用中的代码是关于Java的IO操作和异常处理的,但可能没有直接相关的信息。不过用户提供的引用可能是在其他上下文中提到的,需要确认是否有相关的解决方案。例如,引用[1]中的flush操作可能与资源管理有关,但和HashMap问题关系不大。引用[3]提到了objc_setAssociatedObject,这是Objective-C的API,可能与当前问题无关。 因此,综合来看,主要的解决方案是升级到Java 8+,或者使用ConcurrentHashMap,或者确保在单线程环境下使用HashMap,避免多线程并发修改。同时,用户需要了解HashMap的线程不安全性,并在多线程环境下采取适当的同步措施。 最后,生成相关问题时要围绕HashMap的实现、多线程问题、解决方案等展开,帮助用户进一步理解相关知识点。</think>### Java HashMap头插法导致死循环的解决方案 在Java 8之前的版本中,`HashMap`在多线程扩容时可能因头插法导致链表成环,从而引发死循环问题。以下是具体原因和解决方案: #### **问题原因** 1. **头插法实现** Java 7及更早版本的`HashMap`在插入链表节点时,将新节点置于链表头部(例如`entry.next = table[bucketIndex];`)。扩容时,旧链表的节点会逆序迁移到新数组的桶中。 2. **多线程竞争** 若两个线程同时触发扩容(`resize()`),且旧链表的迁移顺序为`A -> B -> C`,线程1可能在迁移过程中被挂起,而线程2完成迁移后链表变为`C -> B -> A`。当线程1恢复执行时,可能因引用混乱形成环形链表(如`B.next = A`且`A.next = B`),导致后续操作陷入死循环[^1]。 #### **解决方案** 1. **升级到Java 8+** Java 8将链表插入方式改为尾插法,迁移时保持链表顺序不变,避免环形链表的产生。例如: ```java // Java 8 HashMap.resize() 代码片段(简化) Node<K,V> loHead = null, loTail = null; Node<K,V> hiHead = null, hiTail = null; Node<K,V> next; do { next = e.next; if ((e.hash & oldCap) == 0) { if (loTail == null) loHead = e; else loTail.next = e; loTail = e; } else { if (hiTail == null) hiHead = e; else hiTail.next = e; hiTail = e; } } while ((e = next) != null); ``` 通过维护头尾指针,新链表顺序与旧链表一致[^2]。 2. **使用线程安全的容器** 在多线程场景中,优先使用`ConcurrentHashMap`。其内部通过分段锁(Java 7)或CAS+synchronized(Java 8+)保证线程安全,避免死循环问题: ```java Map<String, String> safeMap = new ConcurrentHashMap<>(); ``` 3. **避免多线程直接操作HashMap** 若必须使用旧版本Java,需通过同步机制控制并发访问: ```java Map<String, String> map = Collections.synchronizedMap(new HashMap<>()); ``` #### **代码对比示例** - **Java 7的头插法(危险)** ```java void transfer(Entry[] newTable) { for (Entry<K,V> e : table) { while (e != null) { Entry<K,V> next = e.next; int i = indexFor(e.hash, newCapacity); e.next = newTable[i]; // 头插法 newTable[i] = e; e = next; } } } ``` - **Java 8的尾插法(安全)** ```java final Node<K,V>[] resize() { // ... 维护loHead/loTail和hiHead/hiTail if (loTail != null) { loTail.next = null; newTab[j] = loHead; // 直接挂载链表头 } if (hiTail != null) { hiTail.next = null; newTab[j + oldCap] = hiHead; } } ``` #### **总结** - **根本原因**:头插法 + 多线程竞争导致链表成环。 - **推荐方案**:升级至Java 8+,或使用`ConcurrentHashMap`。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值