参考文章:https://www.cnblogs.com/liujinhong/p/6576543.html
参考文章:https://blog.youkuaiyun.com/qq_42034205/article/details/90384772
一直没有深入理解hashcode的hash原理,今天看了别人的博客,恍然大悟,这里记录下,希望能多保留几天印象。。。
jdk1.8版本
实现原理是,HashMap中维护一个Node[] 数组,存放节点,如果存在hash冲突,使用树形结构解决hash冲突,也就是每个数组元素实际上是hash值相同的元素组成的链表的头节点
如下图代码,put的时候,调用hash(Object key)方法得到key的hash值,这里重点是看他的hash算法
(h = key.hashCode()) ^ (h >>> 16)
tab[i = (n - 1) & hash]
相当于,我放进去一组数据(k,v),这组数据在map数组中的下标是 (n-1) & ((h = key.hashCode()) ^ (h >>> 16))
为什么这么做:
1.先说 (n-1),这里n实际上是map数组的长度,也就是(length-1),&运算这里相当于将hashcode % (length-1),这样所有元素在map数组中的取值范围就是0-(length-1),这没什么好说的,理当如此
2.再说(h = key.hashCode()) ^ (h >>> 16),我们知道好的hash算法要尽量避免哈希冲突
而所谓hash冲突就是不同的数据,他们的hash值都一样,这样会导致map数组的某几个下标的数据很多,其他下标却空闲起 来,这样查找的效率肯定很低,因为要花费大量时间去遍历链表,众所周知链表查找效率很低,适合增删。解决办法就是让hash值更加随机,做法是让hashCode的高16位和低16位异或。
那为什么是高16位和低16位异或呢?从上面的计算方式我们知道,最终这个hash值要和(length-1)取余,而实际生产中length大多情况是不超过2的16次方的也就是length的高16位是00000000 00000000。那么这个 &运算 实际上大多情况就变成了 hash的低16位和length的低16位的运算,hashCode的高16位很多情况下没参与运算,那么我们把hashCode的高16位拿来和低16位异或一下,这样相当于hashCode的高低位都参与了和lenght的运算,由于参与的因素更多,所以结果肯定更随机,perfect!
重要的方法和结构如下
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
Node(int hash, K key, V value, Node<K,V> next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
}
此方法只截取这一段
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);