慢慢攻略HashMap(3)——put方法篇

最新推荐文章于 2024-05-23 11:12:13 发布

原创最新推荐文章于 2024-05-23 11:12:13 发布 · 1.3k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#java #哈希算法 #散列表 #数据结构 #经验分享

本文深入剖析了HashMap的put方法，讲解了hash函数如何计算键的路由寻址并保持高位信息，同时揭示了putVal方法中扩容、替换及节点操作的细节。

本篇主要介绍了HashMap源码中put方法部分

下面展示关于put方法的 HashMap底层源码。

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}

由代码可见：实际上 put 只是套娃了一个 putVal 方法

所以我们要去看一下putVal方法，从putVal方法的参数可以看出，里面包括了一个hash方法，参数为key：

hash(key)

这个方法是干什么的呢？我们来一探究竟。
首先来看看hash（key）的源码

static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

这段代码称 扰动函数
作用：让key的hash值的高16位也参与路由寻址运算

举个🌰：
假设传进来的key的hashcode值赋给h后，h = 0b 0010 0101 1010 1100 0011 1111 0010 1110，根据源码进行^异或运算：

0b 0010 0101 1010 1100 0011 1111 0010 1110 （h）
^
0b 0000 0000 0000 0000 0010 0101 1010 1100 (h >>> 16)

=> 0010 0101 1010 1100 0001 1010 1000 0010

以上运算是为了让高16位和低16位做运算
也算是变相地保留了高位的信息，让高16位也参与路由寻址。
小疑问：h >>> 16是干什么？
答：如果不进行右移运算，没法让高16位与低16位进行运算。

看完了hash方法，可以正式的看一下putVal方法了：每行的注释我已经加进去了…

/**
     * Implements Map.put and related methods
     *
     * @param hash hash for key key的hash值
     * @param key the key
     * @param value the value to put
     * @param onlyIfAbsent if true, don't change existing value 如果散列表当中某一个key和你插入的key是一样的就不插了 
     * @param evict if false, the table is in creation mode.
     * @return previous value, or null if none
     */
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    //tab：引用当前hashmap的散列表
    //p：表示当前散列表的元素
    //n：表示散列表数组的长度
    //i：表示路由寻址的结果
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    
    //1号🌰延迟初始化逻辑，第一次调用putVal时会初始化hashMap对象中的最耗费内存的散列表
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    //2号🌰最简单的一种情况：寻址都找到的桶位放好是null，这个时候，应该将当前k-v=>ode 扔进去就行了
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    
    else {
        //e：不为null的话，找到了一个与当前要插入的key-value一致的key元素
        //k：表示临时的一个key
        Node<K,V> e; K k;
        
        //传进来的hash值等于已经存在p的哈希值 并且传进来的key也和p的key一样 
        //也就表示当前桶位中的元素，与你当前插入的元素的key完全一致，表示后续需要进行替换操作
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        
        //p已经树化了
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        else {
            //链表的情况，并且链表的头元素与我们要插入的key不一致 我们得遍历链表了
            for (int binCount = 0; ; ++binCount) {
                
                //条件成立的话，说明迭代到最后一个元素了，也没找到一个与你要插入的key一致的node
                //说明允许加入到当前链表的末尾
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    //如果链表长度大于8 就得进行树化操作了
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                //条件成立的话，说明找到相同key的node元素，break出去 然后进行替换操作
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        //替换操作 e!=null 说明找到了与你插入数据一致的元素，把老value输出，把老值换成新值
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
    }
    //表示散列表结构被修改次数，替换node元素的value不计数
    ++modCount;
    //插入新元素，size自增，如果自增后的值大于扩容阈值就扩容
    if (++size > threshold)
        //3号🌰扩容方法
        resize();
    afterNodeInsertion(evict);
    return null;
}

以上标记🌰的位置是重点：

X位置	重点
1号🌰	延迟初始化
2号🌰	(n - 1) & hash 求下标方法
3号🌰	resize() 扩容方法

1号🌰

if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;

如果table为null，那么就初始化table散列表，resize中有扩容方法。

2号🌰

if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);

如果通过下标运算定位的位置是null，那就直接把key-value扔到该位置就行了。
(n - 1) & hash：下标运算。

补充——核心知识点：为什么 table 的长度一定是2的幂

计算下标得算法，实际就是取模，hash%length，

计算机中直接求余效率不如位移运算，源码中做了优化hash&(length-1)

要想保证hash%length==hash&(length-1)

那么length必须是2的n次方；

3号🌰

if (++size > threshold)
        resize();

size大于负载因子时进行扩容，扩容方法下期讲~~~~

本博客仅供学习参考，也是个人笔记总结，如果错误请见谅~~

慢慢攻略HashMap(3)——put方法篇

********本篇主要介绍了HashMap源码中put方法部分********

本篇主要介绍了HashMap源码中put方法部分