HashMap底层源码解析下（超详细图解）

最新推荐文章于 2024-07-26 22:59:15 发布

原创

最新推荐文章于 2024-07-26 22:59:15 发布 · 3k 阅读

27 ·

CC 4.0 BY-SA版权

文章标签：

#java #后端 #数据结构 #hashmap #源码

前情回顾
红黑树原理+手写红黑树代码
 HashMap底层源码解析上

文章目录

前言
HashMap成员方法
遍历HashMap集合的几种方式

前言

HashMap成员方法

put(K key, V value)

put方法是比较复杂的，实现步骤大致如下

先通过hash值计算出key映射到哪个桶
如果桶上没有碰撞冲突，则直接插入
如果出现碰撞冲突了，则需要处理冲突
- 如果该桶使用红黑树处理冲突，则调用红黑树的方法插入数据
- 否则采用传统的链式方式插入，如果链的长度达到临界值，将链转变成红黑树
如果桶中存在重复的键，则为该键替换新值value
如果size大于阈值threshold，则进行扩容

具体的方法如下

    public V put(K key, V value) {
   
   
        //根据key计算其hash值
        return putVal(hash(key), key, value, false, true);
    }

    static final int hash(Object key) {
   
   
        int h;
        //key可以为null，如果为null，hash值就为0，将其放在数组的第一个位置上，和hashTable不一样，hashTable中key不允许为null
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

我们可以看到在putVal()方法中key在这里执行了一下hash()方法，来看一下hash()方法是如何实现的

    static final int hash(Object key) {
   
   
        int h;
        /*
            1)如果key等于null
                可以看到key等于null的时候也是有哈希值的，此时为0，如果进行寻址
                会找到数组的第一个位置
            2)如果key不等于null
                首先计算出key的hashCode赋值给h，然后与h的无符号后移16位的二进制数进行按位异或
                得到最后的hash值
         */
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

从上面可以得知HashMap是支持key为空的，而HashTable是直接用key来获取HashCode，如果key为空则会抛空指针异常

其实上面就已经解释了为什么HashMap的长度为什么要是2的幂，因为HashMap使用的方法很巧妙，他通过hash&(table.length-1)来获得该对象的保存位，前面说过HashMap的底层数组的长度总是2的n次方，这是HashMap在速度上的优化。当length总是2的n次方时，hash&(length-1)运算等价于对length取模，也就是hash%length，但是&比%具有更高的效率，比如n%32=n&(32-1)

解读上述hash方法：

我们先研究下key的哈希值是如何计算出来的，key的哈希值是通过上述方法计算出来的
这个哈希方法首先计算出key的hashCode赋值给h，然后与h无符号右移16位后的二进制数进行按位异或得到最后的hash值

在putVal函数中使用到了上述hash函数计算的hash值

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
   
   
    。。。。。。。。。。
         //p为存储空间的索引
        if ((p = tab[i = (n - 1) & hash]) == null)
    。。。。。。。。。。
}

hash值计算过程如下

说明：

key.hashCode():返回散列值就是hashCode,假设是随便生成的一个值
n表示数组初始化的长度为16
&（按位与运算）：运算规则：相同的二进制数位上，都是1的时候结果为1，否则为0
^（按位异或运算）：运算规则：相同的二进制数位上，数字相同，结果为0，不同为1

总流程：
在这里插入图片描述
简单来说就是：

高16bit不变，低16bit和高16bit做了一个异或（得到的hashcode转化为32位二进制，前16位和后16位低16bit和高16bit做了一个异或）

问题，为什么要让高16位也参与运算呢

如果当n即数组长度很小，假设是16的话，那么n-1为1111,这样的值和hashCode()直接做按位与操作，实际上只使用了hash值的后4位，如果当哈希值的高位变化很大，低位变化很小，这样就很容易造成哈希冲突了，所以这里把高低位都利用起来，从而解决了这个问题

我们还是举个例子吧

如果不对h进行按位异或操作，而直接将hashCode值与n-1进行与操作，就会出现这样的情况，我们将数据存放在索引为10的空间中

在这里插入图片描述
当我们得到一个高位变化比较大的hashCode时，它的高位就无法参与&运算，比如：我们发现他得到的索引值依然为10，这样就会引起hash冲突

在这里插入图片描述

故：如果hashCode值的高位变化很大，而低位变化很小或没有变化，那么直接和数组长度进行&运算。会很容易造成计算的结果是一样的，导致hash冲突，而>>>16便是使高混乱度地区与低混乱度地区做一个中和，提高低位的随机性，减少哈希冲突

这里博客中有位老哥总结的很好：

右移16位，自己的高半区和低半区异或，就是为了混合原始哈希码的高位和低位，以此来加大低位随机性。

现在我们回到putVal方法，看看它具体做了什么

主要参数：

- hash key的hash值

- key原始key

- value要存放的值

- onlyIfAvsent如果true代表不更改现有的值

- evict如果为false表示table为创建状态

putVal()方法源代码以及逐行解释如下所示：

    /**
     * Implements Map.put and related methods
     *
     * @param hash hash for key
     * @param key the key
     * @param value the value to put
     * @param onlyIfAbsent if true, don't change existing value
     * @param evict if false, the table is in creation mode.
     * @return previous value, or null if none
     */
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
   
   
        //tab:引用当前hashmap的散列表
        //p:表示当前散列表的元素
        //n:表示散列表数组的长度
        //i:表示路由寻址结果
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        //延迟初始化逻辑，在这里初始化table，第一次调用putVal方法会创建
        //hashMap中最耗费内存的散列表，如果只是new HashMap()并不会初始化散列表
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        //如果当前桶没有哈希冲突，则直接添加
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        //有哈希冲突，则对链表或红黑树情况分别进行判断
        else {
   
   
            Node<K,V> e; K k;
            //p.hash == hash &&((k = p.key) == key 将p.key赋给k，并判断与当前节点的hash值是否相等
            //与当前节点地址值是否相等，相等则直接覆盖原节点
            //key != null && key.equals(k)，如果key不是空，并且内容相等（一般情况下内容相等默认hash值也相等）
            //则直接覆盖原节点
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            //判断是否是树节点
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
   
   
                //是链表，并且头节点和我们要插入的节点不一致
                //for循环：遍历每个节点，确定要插入的位置
                for (int binCount = 0; ; ++binCount) {
   
   
                    //如果当前节点的下一个节点为null，代表已经到了最后一个节点位置
                    if ((e = p.next) == null) {
   
   
                        //将元素作为新节点插入到链表末尾
                        p.next = newNode