JDK8中对hash算法和寻址算法是如何优化的?

(逼自己读源码的第一天)



寻址算法:


我先简单复述一遍HashMap的寻址算法:
(关于下面这段话,请始终记得,这是一个结点数组,你可以想象为桶排序的桶,每个结点位置都是一个桶。)

  • 首先要明确这个算法的数据结构是有数组+链表+红黑树组成的。
  • 然后他是怎么组成的呢?
    • 首先总体是一个结点数组,然后通过对传入的key进行hash计算,得到一个对应位置,到节点数组中找。
    • 如果该位置存在,并且值相等,则直接返回。
    • 否则在判断该结点的指针next指向的下一个元素是否为空,非空的话是红黑树结点还是链表结点。(这里是处理散列冲突的方式,一会儿说)
    • 如果是红黑树,则进入到红黑树中,通过红黑树的方式查找。(时间复杂度O(log n))
    • 否则则是链表,顺序查找。(时间复杂度O(n))
    • 如果这个链表里面都没有,则说明这整个结点数组里面没有,返回null。

       下面这幅图是根据源代码的ifwhile一步一步画出来的,文字比较直译,所以请先看上面的文字,看下面会好受一点儿。(第一次写,语言表达有点儿问题,望见谅)

Yes
Yes
Yes
Yes
Yes
No
Yes
Yes
No
No
Yes
Yes
Yes
No
Node数组非空
数组长度不为零
与运算后的的索引为非空且存入first中
检查first是否为空
first的key值k是否和传参key相等或key的内容是否和k相等
找到了对应的Node
结束
取first这个节点的链表是否有下一个节点存入e且非空
first节点是否是红黑树节点
调用红黑树方法继续找
说明当前节还是一个链表
循环遍历当前链表
是否找到指定key值
则返回对应节点

源码如下:

/**
* The table, initialized on first use, and resized as
* necessary. When allocated, length is always a power of two.
* (We also tolerate length zero in some operations to allow
* bootstrapping mechanics that are currently not needed.)
* 
* table,这个表第一次使用会被初始化,必要时可调整大小。长度一直被
* 分配为2的次幂。(我们也能允许在一些操作中他的长度为0,这些操作所
* 支持的技术当前不需要的时候。)
*/
transient Node<K,V>[] table;

final Node<K,V> getNode(int hash, Object key) {
        Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (first = tab[(n - 1) & hash]) != null) {
            if (first.hash == hash && // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))
                return first;
            if ((e = first.next) != null) {
                if (first instanceof TreeNode)
                    return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                do {
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        return e;
                } while ((e = e.next) != null);
            }
        }
        return null;
    }


hash算法相对简单一些:


static final int hash(Object key){
int h;
return (key==null)? 0 : (h=key.hashcode())^(h>>>16);
}

       首先,我们明确知道,一个value的hash值是32位的,这里无符号右位移16位,相当于砍掉了一般,留下了高位16个,然后前面先让h赋值为key的完整的hash值,在进行异或运算,就相当于高位16个和低位16个进行的异或运算,这样就把这个value的所有特征保留下来了,这样可以尽可能的减少散列冲突的次数,增加散列查找的效率。(时间复杂度O(1))
       而且,与运算的运算速度是很快的,整个过程的运算时间是极少的。



散列冲突处理方法


       首先结点数组的每个结点初始都是以链表解决冲突的。(我们先想象每个结点位置都是一个桶)

  • 当发生散列冲突的时候,会让冲突位置的结点所在的链表后面连上存进来的冲突的值,就相当于往桶里扔了一个值。
  • 如果发生冲突的位置的桶里的结点已经超过8个(HashMap的阈值为8)的时候,则会转换成红黑树,提高散列查找效率。
    所以查找效率就是 O(1)+O(n)O(1)+O(log n),一般为O(1)。(因为散列插入的大部分都是以数组方式查找的)

       以上就是我个人的理解和笔记,我这里更多的是做自己的理解和以后的温习更新知识,小伙伴们如果有什么新的见解,欢迎评论一起讨论     ~ . ~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

为什么我不是源代码

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值