按照常规流程:
实例化HashMap对象时:
HashMap<String, String> hashMap = new HashMap<>();
从代码中可以看出
只是将负载因子设置为默认的0.75,并未作其他的操作。此时的hashmap还是一个空的map。
那么,hashmap是在什么时候设置容量的呢?
1.当调用无参数的构造函数创建hashmap对象时,是在第一次调用put()方法添加元素时。
put方法中调用了putVal方法,其中调用了哈希算法hash()。
哈希算法:首先调用Object的hashCode()方法算出key的哈希值,该方法在native层实现。接着将key的哈希值(int型32位)无符号右移16位,即取它的高16位返回,右移后高16位变成0,原高16位移动到低16位。问题:为什么哈希算法要哈希值和其高16位进行异或运算?
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
put()方法
- 问题1:tab[i = (n - 1) & hash] 通过数组最大下标n-1与哈希值hash进行按位与运算来获取元素的数组索引,为什么?
- 问题2:不冲突时,直接插入数组中,而发生哈希碰撞导致冲突时,会怎么样?
- 2.答:产生哈希碰撞时,JDK1.8之后都是采用尾插法,往链表尾部插入数据。当链表长度大于等于8时,链表会转换成红黑树。
- 问题3、为什么jdk1.7及之前采用的都是头插法,为什么JDK1.8之后采用尾插法?
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K, V>[] tab;
Node<K, V> p;
int n, i;
// 如果链表数组为空,则调用resize()初始化
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
//tab[i = (n - 1) & hash] 数组最大下标n-1与哈希值hash进行按位与运算来获取要插入的元素的索引
if ((p = tab[i = (n - 1) & hash]) == null)
//不冲突的情况,直接创建一个节点对象插入数组中
tab[i] = newNode(hash, key, value, null);
else {
//冲突的情况,会怎么样?
Node<K, V> e;//要保存的新节点
K k;
//1、先获取key保存的位置
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
//1.1 存在相同的key,则新值替换旧值
e = p;
else if (p instanceof TreeNode)
//1.2 红黑树的情况
e = ((TreeNode<K, V>) p).putTreeVal(this, tab, hash, key, value);
else {
//1.3 链表的情况
for (int binCount = 0; ; ++binCount) {
//遍历到链表尾部,往尾结点插值(JDK1.8为尾插法)
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
//如果链表的节点大于等于8,则转换成红黑树
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
// 已经往尾结点插入数据了,跳出循环
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
//2 保存value
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
//3 每次put元素都会判断要不要扩容。如果元素的数量大于阈值,则扩容
if (++size > threshold)
resize();
//LinkedHashMap使用
afterNodeInsertion(evict);
return null;
}
resize()方法
问题1:扩容时,原数组中的元素会怎么插入到新的数组中?
/**
* 初始化或将表大小加倍。如果为null,则按照字段阈值中保存的初始容量目标进行分配。
* 否则,因为我们使用二次幂扩展,来自每个bin的元素必须保持在相同的索引,或者在新表中以两个偏移的幂移动。
*/
final Node<K, V>[] resize() {
Node<K, V>[] oldTab = table;
int oldCap = (oldTab == null) ? 0 : oldTab.length;
int oldThr = threshold;//旧阈值
int newCap, newThr = 0;
if (oldCap > 0) {
if (oldCap >= MAXIMUM_CAPACITY) {
//容量不能大于最大容量
threshold = Integer.MAX_VALUE;
return oldTab;
//阈值和容量都翻倍扩容
} else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // double threshold
} else if (oldThr > 0) // initial capacity was placed in threshold
newCap = oldThr;
else { // zero initial threshold signifies using defaults
//初始化容量16和阈值16*0.75=12
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int) (DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
if (newThr == 0) {
float ft = (float) newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float) MAXIMUM_CAPACITY ?
(int) ft : Integer.MAX_VALUE);
}
threshold = newThr;
//扩容时都会创建一个新的数组,长度为原先的两倍
@SuppressWarnings({"rawtypes", "unchecked"})
Node<K, V>[] newTab = (Node<K, V>[]) new Node[newCap];
table = newTab;
if (oldTab != null) {
//扩容时,元素会怎么样?
for (int j = 0; j < oldCap; ++j) {
Node<K, V> e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
else if (e instanceof TreeNode)
((TreeNode<K, V>) e).split(this, newTab, j, oldCap);
else { // preserve order
Node<K, V> loHead = null, loTail = null;
Node<K, V> hiHead = null, hiTail = null;
Node<K, V> next;
do {
next = e.next;
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
} else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
get()方法
整体流程:先根据哈希算法获取哈希值,以此找到数组的索引,然后根据索引找到链表,判断头结点是不是要找的元素,不是再判断是红黑树还是链表,如果是链表,则从头结点开始往尾结点找,那么,问题来了,红黑树怎么找?
问题1:红黑树怎么找???
/**
* 返回指定键映射到的值,如果此映射不包含键的映射,则返回{@code null}。
* 更正式地说,如果此映射包含从密钥{@code k}到值{@code v}的映射,
* 使得{@code(key == null?k == null:key.equals(k) )},那么这个方法返回{@code v},否则返回{@code null}。
* (最多只能有一个这样的映射。)。
* <p> {@code null}的返回值不一定</i>表示地图不包含键的映射;也有可能映射将键明确映射到{@code null}。
* {@link #containsKey containsKey}操作可用于区分这两种情况。
*/
public V get(Object key) {
Node<K, V> e;
return (e = getNode(hash(key), key)) == null ? null : e.value;
}
final Node<K, V> getNode(int hash, Object key) {
Node<K, V>[] tab;
Node<K, V> first, e;
int n;
K k;
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
// first 头节点
if (first.hash == hash && // always check first node
((k = first.key) == key || (key != null && key.equals(k))))
//头结点的key等于要查找元素的key,则直接返回头节点
return first;
// 不是头结点,则根据头结点往链表尾部查找
if ((e = first.next) != null) {
//红黑树的怎么找?
if (first instanceof TreeNode)
return ((TreeNode<K, V>) first).getTreeNode(hash, key);
//链表一直找到尾节点
do {
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
return null;
}