概述
官方文档有如下几点描述:
HashMap
实现了Map
接口,所有类型都可以作为key
、value
,包括null
。- 使用
iterator
遍历的顺序是不确定的,希望确定遍历顺序可以使用LinkedHashMap
。 HashMap
不是线程安全的,如果存在多个线程同时对HashMap
进行结构更改(增加/删除元素),需要显式同步。- 如果
iterator
迭代过程中发现HashMap
结构被改变了,会启动fail-fast机制,抛出ConcurrentModificationException
异常。但这种机制并不能保证一定起作用,所以不应该编写依赖于fail-fast机制的代码,最好只在debug时候用。
结构
- 最初的
HashMap
是由链表数组组成的,key-value的存储形式是静态内部类Node
。整个HashMap
是一个Node<K,V>[] table
,table中每个元素都是Bin中的首元素,它们包含一个引用,指向自己所在的Bin的下一个Node。 - 当某个Bin中的元素数量超过阈值
TREEIFY_THRESHOLD
(默认为8)后,这个Bin中元素的排列会由链表变为树。
所以准确地说,Java集合类HashMap
是由链表/树组成的数组构成的。
获取HashCode
HashMap
自然是基于HashCode,但又不是简单的HashCode。HashMap
中真正使用的HashCode是用如下函数计算的:
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
可以看到,调用了key.hashCode()
后,对结果做了高位补0的移位,再和原来的结果做异或,才得到最终使用的HashCode。如果不这样处理,得到的Bin序号可能只受HashCode低位的影响,更可能造成不同Bin中元素数量差异过大,影响查找性能。
插入元素
找到Bin序号
用n表示Bucket的数量,HashMap
中Bin数量限制为2的幂,所以对Bucket数量取余可以写为(n - 1) & hash
,这样就得到元素对应的Bucket的序号i
。有了序号i
就可以找到Bin了,table[i]
即为元素所在的Bin的首元素,接下来判断Bin是否存在。新建Bin
如果这个Bin不存在,也就是table[i] = null
,则在此处新建节点,节点数据即为key和value:
tab[i] = newNode(hash, key, value, null)
增加Bin节点
如果Bin存在,也就是发生了哈希冲突,就要为这个Bin增加节点。过程是:- 遍历Bin,如果发现了key相等的元素,则替换掉key对应的value,停止遍历,进入下一个步骤。
- 如果遍历过程中发现该Bin中元素数量超过了阈值
TREEIFY_THRESHOLD
,则对该Bin进行Treeify(),将原来的链表变为树。 - 如果遍历完了没有发现key相等的元素,就在尾部增加Node节点。
后续操作
如果HashMap
的size超过了阈值,则进行resize(),阈值是loadFactor乘以table.length。
最后附上put()
的代码:
put()方法:
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
putVal()方法:
/**
* Implements Map.put and related methods
*
* @param hash hash for key
* @param key the key
* @param value the value to put
* @param onlyIfAbsent if true, don't change existing value
* @param evict if false, the table is in creation mode.
* @return previous value, or null if none
*/
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}