(逼自己读源码的第一天)
寻址算法:
我先简单复述一遍HashMap的寻址算法:
(关于下面这段话,请始终记得,这是一个结点数组,你可以想象为桶排序的桶,每个结点位置都是一个桶。)
- 首先要明确这个算法的数据结构是有数组+链表+红黑树组成的。
- 然后他是怎么组成的呢?
- 首先总体是一个结点数组,然后通过对传入的key进行hash计算,得到一个对应位置,到节点数组中找。
- 如果该位置存在,并且值相等,则直接返回。
- 否则在判断该结点的指针next指向的下一个元素是否为空,非空的话是红黑树结点还是链表结点。(这里是处理散列冲突的方式,一会儿说)
- 如果是红黑树,则进入到红黑树中,通过红黑树的方式查找。(时间复杂度O(log n))
- 否则则是链表,顺序查找。(时间复杂度O(n))
- 如果这个链表里面都没有,则说明这整个结点数组里面没有,返回null。
下面这幅图是根据源代码的if、while一步一步画出来的,文字比较直译,所以请先看上面的文字,看下面会好受一点儿。(第一次写,语言表达有点儿问题,望见谅)
源码如下:
/**
* The table, initialized on first use, and resized as
* necessary. When allocated, length is always a power of two.
* (We also tolerate length zero in some operations to allow
* bootstrapping mechanics that are currently not needed.)
*
* table,这个表第一次使用会被初始化,必要时可调整大小。长度一直被
* 分配为2的次幂。(我们也能允许在一些操作中他的长度为0,这些操作所
* 支持的技术当前不需要的时候。)
*/
transient Node<K,V>[] table;
final Node<K,V> getNode(int hash, Object key) {
Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
if (first.hash == hash && // always check first node
((k = first.key) == key || (key != null && key.equals(k))))
return first;
if ((e = first.next) != null) {
if (first instanceof TreeNode)
return ((TreeNode<K,V>)first).getTreeNode(hash, key);
do {
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
return null;
}
hash算法相对简单一些:
static final int hash(Object key){
int h;
return (key==null)? 0 : (h=key.hashcode())^(h>>>16);
}
首先,我们明确知道,一个value的hash值是32位的,这里无符号右位移16位,相当于砍掉了一般,留下了高位16个,然后前面先让h赋值为key的完整的hash值,在进行异或运算,就相当于高位16个和低位16个进行的异或运算,这样就把这个value的所有特征保留下来了,这样可以尽可能的减少散列冲突的次数,增加散列查找的效率。(时间复杂度O(1))
而且,与运算的运算速度是很快的,整个过程的运算时间是极少的。
散列冲突处理方法
首先结点数组的每个结点初始都是以链表解决冲突的。(我们先想象每个结点位置都是一个桶)
- 当发生散列冲突的时候,会让冲突位置的结点所在的链表后面连上存进来的冲突的值,就相当于往桶里扔了一个值。
- 如果发生冲突的位置的桶里的结点已经超过8个(HashMap的阈值为8)的时候,则会转换成红黑树,提高散列查找效率。
所以查找效率就是 O(1)+O(n) 或 O(1)+O(log n),一般为O(1)。(因为散列插入的大部分都是以数组方式查找的)
以上就是我个人的理解和笔记,我这里更多的是做自己的理解和以后的温习更新知识,小伙伴们如果有什么新的见解,欢迎评论一起讨论 ~ . ~