前情回顾
红黑树原理+手写红黑树代码
HashMap底层源码解析上
文章目录
前言
HashMap成员方法
put(K key, V value)
put方法是比较复杂的,实现步骤大致如下
-
先通过hash值计算出key映射到哪个桶
-
如果桶上没有碰撞冲突,则直接插入
-
如果出现碰撞冲突了,则需要处理冲突
-
如果该桶使用红黑树处理冲突,则调用红黑树的方法插入数据
-
否则采用传统的链式方式插入,如果链的长度达到临界值,将链转变成红黑树
-
-
如果桶中存在重复的键,则为该键替换新值value
-
如果size大于阈值threshold,则进行扩容
具体的方法如下
public V put(K key, V value) {
//根据key计算其hash值
return putVal(hash(key), key, value, false, true);
}
static final int hash(Object key) {
int h;
//key可以为null,如果为null,hash值就为0,将其放在数组的第一个位置上,和hashTable不一样,hashTable中key不允许为null
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
我们可以看到在putVal()方法中key在这里执行了一下hash()方法,来看一下hash()方法是如何实现的
static final int hash(Object key) {
int h;
/*
1)如果key等于null
可以看到key等于null的时候也是有哈希值的,此时为0,如果进行寻址
会找到数组的第一个位置
2)如果key不等于null
首先计算出key的hashCode赋值给h,然后与h的无符号后移16位的二进制数进行按位异或
得到最后的hash值
*/
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
从上面可以得知HashMap是支持key为空的,而HashTable是直接用key来获取HashCode,如果key为空则会抛空指针异常
- 其实上面就已经解释了为什么HashMap的长度为什么要是2的幂,因为HashMap使用的方法很巧妙,他通过hash&(table.length-1)来获得该对象的保存位,前面说过HashMap的底层数组的长度总是2的n次方,这是HashMap在速度上的优化。当length总是2的n次方时,hash&(length-1)运算等价于对length取模,也就是hash%length,但是&比%具有更高的效率,比如n%32=n&(32-1)
解读上述hash方法:
我们先研究下key的哈希值是如何计算出来的,key的哈希值是通过上述方法计算出来的
这个哈希方法首先计算出key的hashCode赋值给h,然后与h无符号右移16位后的二进制数进行按位异或得到最后的hash值
在putVal函数中使用到了上述hash函数计算的hash值
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
。。。。。。。。。。
//p为存储空间的索引
if ((p = tab[i = (n - 1) & hash]) == null)
。。。。。。。。。。
}
hash值计算过程如下
说明:
- key.hashCode():返回散列值就是hashCode,假设是随便生成的一个值
- n表示数组初始化的长度为16
- &(按位与运算):运算规则:相同的二进制数位上,都是1的时候结果为1,否则为0
- ^(按位异或运算):运算规则:相同的二进制数位上,数字相同,结果为0,不同为1
总流程:

简单来说就是:
- 高16bit不变,低16bit和高16bit做了一个异或(得到的hashcode转化为32位二进制,前16位和后16位低16bit和高16bit做了一个异或)
问题,为什么要让高16位也参与运算呢
如果当n即数组长度很小,假设是16的话,那么n-1为1111,这样的值和hashCode()直接做按位与操作, 实际上只使用了hash值的后4位,如果当哈希值的高位变化很大,低位变化很小,这样就很容易造成哈希冲突了,所以这里把高低位都利用起来,从而解决了这个问题
我们还是举个例子吧
如果不对h进行按位异或操作,而直接将hashCode值与n-1进行与操作,就会出现这样的情况,我们将数据存放在索引为10的空间中

当我们得到一个高位变化比较大的hashCode时,它的高位就无法参与&运算,比如:我们发现他得到的索引值依然为10,这样就会引起hash冲突

故:如果hashCode值的高位变化很大,而低位变化很小或没有变化,那么直接和数组长度进行&运算。会很容易造成计算的结果是一样的,导致hash冲突,而>>>16便是使高混乱度地区与低混乱度地区做一个中和,提高低位的随机性,减少哈希冲突
这里博客中有位老哥总结的很好:
右移16位,自己的高半区和低半区异或,就是为了混合原始哈希码的高位和低位,以此来加大低位随机性。
现在我们回到putVal方法,看看它具体做了什么
主要参数:
- hash key的hash值
- key原始key
- value要存放的值
- onlyIfAvsent如果true代表不更改现有的值
- evict如果为false表示table为创建状态
putVal()方法源代码以及逐行解释如下所示:
/**
* Implements Map.put and related methods
*
* @param hash hash for key
* @param key the key
* @param value the value to put
* @param onlyIfAbsent if true, don't change existing value
* @param evict if false, the table is in creation mode.
* @return previous value, or null if none
*/
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
//tab:引用当前hashmap的散列表
//p:表示当前散列表的元素
//n:表示散列表数组的长度
//i:表示路由寻址结果
Node<K,V>[] tab; Node<K,V> p; int n, i;
//延迟初始化逻辑,在这里初始化table,第一次调用putVal方法会创建
//hashMap中最耗费内存的散列表,如果只是new HashMap()并不会初始化散列表
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
//如果当前桶没有哈希冲突,则直接添加
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
//有哈希冲突,则对链表或红黑树情况分别进行判断
else {
Node<K,V> e; K k;
//p.hash == hash &&((k = p.key) == key 将p.key赋给k,并判断与当前节点的hash值是否相等
//与当前节点地址值是否相等,相等则直接覆盖原节点
//key != null && key.equals(k),如果key不是空,并且内容相等(一般情况下内容相等默认hash值也相等)
//则直接覆盖原节点
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
//判断是否是树节点
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
//是链表,并且头节点和我们要插入的节点不一致
//for循环:遍历每个节点,确定要插入的位置
for (int binCount = 0; ; ++binCount) {
//如果当前节点的下一个节点为null,代表已经到了最后一个节点位置
if ((e = p.next) == null) {
//将元素作为新节点插入到链表末尾
p.next = newNode

最低0.47元/天 解锁文章
5483





