与1.7对比
- 数据结构:1.7是hash数组 + 链表;1.8采用hash数组 + 链表 + 红黑树;
- 数据插入:1.7头插法;1.8尾插法;
- 扩容后数据分布方式:1.7是对所有key重新hash(key的hash值的二进制 & length-1的二进制);1.8是原位置或者(原位置+oldlen)
四个关键常量(扩容&链表转红黑树)
- DEFAULT_LOAD_FACTOR 扩容因子
threshold = table长度 * 扩容因子
- TREEIFY_THRESHOLD & MIN_TREEIFY_CAPACITY 控制链表转红黑树
链表转红黑树的两个条件
- UNTREEIFY_THRESHOLD 控制红黑树转链表
头插法和尾插法对比
- 头插法会导致链表逆序&死循环(引用网络图)
hash计算方法
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
可以看到,先计算key的hashcode,然后和计算的hashcode高16位异或;
为什么需要和高16位异或?
1、但由于绝大多数情况下length一般都小于2^16即小于65536。所以return h & (length-1);结果始终是h的低16位与(length-1)进行&运算。如下例子(hashcode为四字节)
由于和(length-1)运算,length 绝大多数情况小于2的16次方。所以始终是hashcode 的低16位(甚至更低)参与运算。要是高16位也参与运算,会让得到的下标更加散列。
所以这样高16位是用不到的,如何让高16也参与运算呢。所以才有hash(Object key)方法。让他的hashCode()和自己的高16位^运算。所以(h >>> 16)得到他的高16位与hashCode()进行^运算。
为什么用^而不用&和|
因为&和|都会使得结果偏向0或者1 ,并不是均匀的概念,所以用^。
这就是为什么有hash(Object key)的原因。