HashMap底层源码解析下(超详细图解)

前情回顾
红黑树原理+手写红黑树代码
HashMap底层源码解析上


前言

HashMap成员方法

put(K key, V value)

put方法是比较复杂的,实现步骤大致如下

  1. 先通过hash值计算出key映射到哪个桶

  2. 如果桶上没有碰撞冲突,则直接插入

  3. 如果出现碰撞冲突了,则需要处理冲突

    • 如果该桶使用红黑树处理冲突,则调用红黑树的方法插入数据

    • 否则采用传统的链式方式插入,如果链的长度达到临界值,将链转变成红黑树

  4. 如果桶中存在重复的键,则为该键替换新值value

  5. 如果size大于阈值threshold,则进行扩容

具体的方法如下

    public V put(K key, V value) {
   
   
        //根据key计算其hash值
        return putVal(hash(key), key, value, false, true);
    }

    static final int hash(Object key) {
   
   
        int h;
        //key可以为null,如果为null,hash值就为0,将其放在数组的第一个位置上,和hashTable不一样,hashTable中key不允许为null
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

我们可以看到在putVal()方法中key在这里执行了一下hash()方法,来看一下hash()方法是如何实现的

    static final int hash(Object key) {
   
   
        int h;
        /*
            1)如果key等于null
                可以看到key等于null的时候也是有哈希值的,此时为0,如果进行寻址
                会找到数组的第一个位置
            2)如果key不等于null
                首先计算出key的hashCode赋值给h,然后与h的无符号后移16位的二进制数进行按位异或
                得到最后的hash值
         */
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

从上面可以得知HashMap是支持key为空的,而HashTable是直接用key来获取HashCode,如果key为空则会抛空指针异常

  • 其实上面就已经解释了为什么HashMap的长度为什么要是2的幂,因为HashMap使用的方法很巧妙,他通过hash&(table.length-1)来获得该对象的保存位,前面说过HashMap的底层数组的长度总是2的n次方,这是HashMap在速度上的优化。当length总是2的n次方时,hash&(length-1)运算等价于对length取模,也就是hash%length,但是&比%具有更高的效率,比如n%32=n&(32-1)

解读上述hash方法:

我们先研究下key的哈希值是如何计算出来的,key的哈希值是通过上述方法计算出来的
这个哈希方法首先计算出key的hashCode赋值给h,然后与h无符号右移16位后的二进制数进行按位异或得到最后的hash值

在putVal函数中使用到了上述hash函数计算的hash值

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
   
   
    。。。。。。。。。。
         //p为存储空间的索引
        if ((p = tab[i = (n - 1) & hash]) == null)
    。。。。。。。。。。
}

hash值计算过程如下

说明:

  • key.hashCode():返回散列值就是hashCode,假设是随便生成的一个值
  • n表示数组初始化的长度为16
  • &(按位与运算):运算规则:相同的二进制数位上,都是1的时候结果为1,否则为0
  • ^(按位异或运算):运算规则:相同的二进制数位上,数字相同,结果为0,不同为1

总流程:
在这里插入图片描述
简单来说就是:

  • 高16bit不变,低16bit和高16bit做了一个异或(得到的hashcode转化为32位二进制,前16位和后16位低16bit和高16bit做了一个异或)

问题,为什么要让高16位也参与运算呢

如果当n即数组长度很小,假设是16的话,那么n-1为1111,这样的值和hashCode()直接做按位与操作, 实际上只使用了hash值的后4位,如果当哈希值的高位变化很大,低位变化很小,这样就很容易造成哈希冲突了,所以这里把高低位都利用起来,从而解决了这个问题

我们还是举个例子吧

如果不对h进行按位异或操作,而直接将hashCode值与n-1进行与操作,就会出现这样的情况,我们将数据存放在索引为10的空间中

在这里插入图片描述
当我们得到一个高位变化比较大的hashCode时,它的高位就无法参与&运算,比如:我们发现他得到的索引值依然为10,这样就会引起hash冲突

在这里插入图片描述

故:如果hashCode值的高位变化很大,而低位变化很小或没有变化,那么直接和数组长度进行&运算。会很容易造成计算的结果是一样的,导致hash冲突,而>>>16便是使高混乱度地区与低混乱度地区做一个中和,提高低位的随机性,减少哈希冲突

这里博客中有位老哥总结的很好:

右移16位,自己的高半区和低半区异或,就是为了混合原始哈希码的高位和低位,以此来加大低位随机性。

现在我们回到putVal方法,看看它具体做了什么

主要参数:

- hash key的hash值

- key原始key

- value要存放的值

- onlyIfAvsent如果true代表不更改现有的值

- evict如果为false表示table为创建状态

putVal()方法源代码以及逐行解释如下所示:

    /**
     * Implements Map.put and related methods
     *
     * @param hash hash for key
     * @param key the key
     * @param value the value to put
     * @param onlyIfAbsent if true, don't change existing value
     * @param evict if false, the table is in creation mode.
     * @return previous value, or null if none
     */
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
   
   
        //tab:引用当前hashmap的散列表
        //p:表示当前散列表的元素
        //n:表示散列表数组的长度
        //i:表示路由寻址结果
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        //延迟初始化逻辑,在这里初始化table,第一次调用putVal方法会创建
        //hashMap中最耗费内存的散列表,如果只是new HashMap()并不会初始化散列表
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        //如果当前桶没有哈希冲突,则直接添加
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        //有哈希冲突,则对链表或红黑树情况分别进行判断
        else {
   
   
            Node<K,V> e; K k;
            //p.hash == hash &&((k = p.key) == key 将p.key赋给k,并判断与当前节点的hash值是否相等
            //与当前节点地址值是否相等,相等则直接覆盖原节点
            //key != null && key.equals(k),如果key不是空,并且内容相等(一般情况下内容相等默认hash值也相等)
            //则直接覆盖原节点
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            //判断是否是树节点
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
   
   
                //是链表,并且头节点和我们要插入的节点不一致
                //for循环:遍历每个节点,确定要插入的位置
                for (int binCount = 0; ; ++binCount) {
   
   
                    //如果当前节点的下一个节点为null,代表已经到了最后一个节点位置
                    if ((e = p.next) == null) {
   
   
                        //将元素作为新节点插入到链表末尾
                        p.next = newNode
评论 4
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

温文艾尔

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值