学习目录
学习背景
由于整个HashMap底层源码实现很多,很难全部剖析,望见谅,本文主要挑选工作和面试经常遇到的一些重点和难点进行剖析即可,希望对你有所帮助!
在进入正文之前,我们知道JDK底层源码很多地方都用到了位运算以及进制相关的知识,HashMap底层也不例外,二进制是计算机底层存储格式,你电脑上所有东西,文件,视频,音乐,全部是二进制方式存储的,十进制就是我们平时的阿拉伯数字没啥可说,在学习本文时,建议先快速了解下Java几种位运算以及常见进制说明,特别是二进制的位运算,可以查看我的这篇文章进行快速了解下 https://blog.youkuaiyun.com/JustinQin/article/details/120505776
HashMap特性
- 继承AbstractMap抽象类,实现Map接口以及Cloneable, java.io.Serializable克隆和序列化
- 底层是由数组+链表组成的哈希表,JDK1.8链表长度超过8并且table数组大小大于64时才会将链表优化为红黑树
- 增删改查的效率都比较高,但多线程环境下是不安全的,可能存在问题
- 存储的元素是键值对,key键是唯一的,并且允许为key/value为null但不保证顺序
- 通过key的hash值计算出需要存放在哈希表中的数组位置index
- 默认初始化容量大小为0,第一次调用put真正给默认大小16,每次扩容oldCap << 1即原来容量的2倍
- 常用的API方法put(key,value)/get(key)/size()/isEmpty()/containsKey(key)/remove(key)
- 底层源码关键属性table、threshold、loadFactor、modCount、size
HashMap添加元素四步曲
前奏:HashMap如何添加一个元素?
HashMap底层数据结构主要通过put(K key, V value)
方法添加元素,底层四步曲如下:
- 第一步曲:根据key得到hashCode值
- 第二步曲:根据hashCode值计算出hash值
- 第三步曲:根据hash值计算出哈希表数组index下标
- 第四步曲:将元素节点保存到哈希表指定数组index下标
HashMap添加元素的示例代码:
HashMap<Object, Object> map = new HashMap<>();
map.put("name","Justin");
HashMap底层put(key,value)方法源码:
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
再看下,hash方法实现源码:
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
接下来将解读HashMap底层源码添加元素四部曲具体实现
第一步曲:根据key得到hashCode值
以上面示例代码说明,这里key是字符串"name",String重写了计算字符串hashCode值的hashCode()方法,源码如下:
计算得到hashCode值为3373707
第二步曲:根据hashCode值计算出hash值
hash值计算的过程用到了^
(异或)和>>>
(无符号右移)两种位运算
(h = key.hashCode()) ^ (h >>> 16)
即 (3373707) ^ (3373707 >>> 16)
这里为了方便展示,二进制每四位使用空格格式化,位运算过程如下:
计算key="name"的hash值二进制结果是1100110111101010111000
转成十进制为3373752
进制在线转换:https://c.runoob.com/front-end/58/
即计算key="name"的hash值为3373752
,也可以debug断点往后查看hash值刚好也是这个值
第三步曲:根据hash值计算出哈希表数组index下标
公式:i = (n - 1) & hash
这里公式(n - 1) & hash
用到了&
按位与运算(都为1则得1),奥妙之处在于n
表示HashMap中的数组容量大小,并且刚好是16,32,64…2的次方,这种情况其实是等效于 hash % n
取模计算出的数组index下标值,并且下标不会超过容量(n-1)即能够保证不会数组下标越界
但是HashMap这里没有使用%
取模,而是使用位运算,直接对内存数据进行操作,效率最高,如果使用%取模需要先将内存数据转成十进制再进行运算,多了这部分的性能开销,效率会变低
HashTable底层倒是用的%取模,hash值与十六进制0x7FFFFFFF
做按位与运算目的是为了保证hash值始终是正数
有的小伙伴可能会问了,使用%取模计算,那这里为啥HashTable还在用,我想说的是其实也可以优化,只不过HashTable本身就是主打synchronized线程安全,也就不考虑优化%取模为位运算了吧
第四步曲:将元素节点保存到哈希表指定数组index下标
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
//该位置首次添加节点,则直接新建节点添加
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
//如果节点是红黑树,调用方法进行添加元素
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
//如果节点是链表,则遍历链表
for (int binCount = 0; ; ++binCount) {
//遍历链表到最后一个节点
if ((e = p.next) == null) {
//新建节点进行添加
p.next = newNode(hash, key, value, null);
//如果遍历指定位置的链表现有节点已经是大于等于8个了
if (binCount >= TREEIFY_THRESHOLD -