
其实HashMap已经是一个老生常谈的问题了在面试中也是深受面试官喜爱,在网上如果搜索HashMap原理,源码分析得文章也是非常多本文基于jdk1.8分析下扩容原理jdk1.7与jdk1.8最大的差别是解决hash冲突的数据结构由原来的链表变为链表+红黑树

resize方法分析
首先翻一下该方法注释,翻译出来感觉还是很拗口

初始化或者将table长度变为原来的2倍 如果为空,则根据字段阈值中保留的初始容量目标进行分配。否则的话由于通过double原来table方式进行扩展,如果hash桶在原表的位置为index,那么扩容后在新表的索引要么与index相同要么在index+老table的长度的位置
由于resize方法比较长因此分割成几个代码片段进行分析
- 扩容后容量和扩容阈值的计算
- 扩容后老table的数据如何转移到新table中
确定新表的容量和扩容逻辑
- #1 查看老表的容量是否大于0如果大于0判断是否已经超出最大总容量,如果超出最大容量直接返回否则进行步骤#2判断,如果老表容量为小于等于0进入步骤#3,如果老表容量等于0则执行步骤#5
- #2 新表容量为老表容量的2倍,扩容后如果小于最大容量则将新表扩容阈值也变为老表两倍
- #3 老表容量<=0并且扩容阈值大于0则将老表扩容阈值直接赋值给新表,通过如下方式初始化会执行#3,如果老表容量大于等于0执行步骤#4
HashMap map = new HashMap(9);
- #4 使用默认容量和默认扩容阈值,通过以下方式初始化方式会进入该逻辑
HashMap map = new HashMap();
- #5 判断新的扩容阈值是否为0,为0 则根据新表的扩容容量进行初始化
final Node[] resize() { Node[] oldTab = table; int oldCap = (oldTab == null) ? 0 : oldTab.length; int oldThr = threshold; int newCap, newThr = 0; if (oldCap > 0) { if (oldCap >= MAXIMUM_CAPACITY) { threshold = Integer.MAX_VALUE; return oldTab; } else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY) newThr = oldThr << 1; // double threshold } else if (oldThr > 0) // initial capacity was placed in threshold newCap = oldThr; else { // zero initial threshold signifies using defaults newCap = DEFAULT_INITIAL_CAPACITY; newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY); } if (newThr == 0) { float ft = (float)newCap * loadFactor; newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE); } threshold = newThr; ....省略部分代码 }
新旧表数据迁移
- 遍历整个老表所有hash桶,如果桶中节点next指针指向为空直接将该节点hash值与新表容量-1做&操作等价于%操作并分配到新的hash表中,这也是为什么hash的表容量为2的幂次(因为是2的幂次通过这种方式可以高效的求模运算)
- 如果该节点next指针不为空则需要判断当前节点类型,如果是树节点则进行分割重新在新表定位,如果是链表同样也是分割后定位,但是分割方式略有不同
- 树节点分割通过节点的hash值与老表容量&操作将会得到0与非0两种情况,根据2种情况分为2个tree,如果树节点少于8则变为链表
- 链表分割也是做节点hash值与老表容量&操作,如果值为0则node在新表中的位置与老表 相同如果不为0则在新表的位置为老表index+老表长度
final Node[] resize() { ... 省略部分代码 Node[] newTab = (Node[])new Node[newCap]; table = newTab; if (oldTab != null) { for (int j = 0; j < oldCap; ++j) { Node e; if ((e = oldTab[j]) != null) { oldTab[j] = null; if (e.next == null) newTab[e.hash & (newCap - 1)] = e; else if (e instanceof TreeNode) ((TreeNode)e).split(this, newTab, j, oldCap); else { // preserve order Node loHead = null, loTail = null; Node hiHead = null, hiTail = null; Node next; do { next = e.next; if ((e.hash & oldCap) == 0) { if (loTail == null) loHead = e; else loTail.next = e; loTail = e; } else { if (hiTail == null) hiHead = e; else hiTail.next = e; hiTail = e; } } while ((e = next) != null); if (loTail != null) { loTail.next = null; newTab[j] = loHead; } if (hiTail != null) { hiTail.next = null; newTab[j + oldCap] = hiHead; } } } } } return newTab; }
总结
关于hash表长度严格为2的幂次通过上述的操作应该可以发现在两个地方非常有用
- 做%运算可以更高效
- 在进行链表拆分是将原来冲突的链表分为2个链表,因此是2的幂次所以在hash值&操作时链表容量二进制数低位为0所以进行根据是否为0分割