前言
本篇面试题主要展示JDK1.8+ HashMap常见的面试题。
1、HashMap的数据结构
1)JDK1.7:数组+链表
2)JDK1.8+:数组+链表+红黑树,后续主要是针对JDK1.8+的HashMap进行解析,如下图:

2、HashMap的key(键)可以使用对象吗
HashMap的key可以使用对象,K和V是泛型,因此可以使用任意类型。
需要注意的是,使用对象作为key时需要重写equals和hashCode方法,避免因hashCode的值导致出现问题。下图为HashMap类的源码图:

3、HashMap在JDK1.8的变化
1)如果某个链表的长度>=8,并且数组容量>= 64,那么链表将转换为红黑树(数组容量<64,不会转成红黑树,只会扩容)。
2)发生hash碰撞时,JDK1.7会在链表的头部插入,JDK1.8会在链表的尾部插入。
3)Node类代替Entry类。
4、HashMap为什么要引入红黑树
当HashMap整体的容量过时key的冲突率会变高,此时链表的查找性能会降低,因此引入红黑树是为了优化HashMap的查询性能。
5、HashMap为什么不引入AVL树
1)红黑树插入和删除的性能相对更好
对数据频繁的插入和删除操作中,红黑树的平衡调整次数较少,能够更快地完成旋转操作。
在查询比较频繁的操作中,AVL树的查询性能更好,因为AVL树是更加严格的平衡树,所以查询时需要比较的次数更少。
2)红黑树实现相对简单
红黑树由于不需要维护节点的平衡因子,加上代码实现也相对简洁,因此相对AVL树,红黑树更加简单。
3)红黑树占用空间更少
由于AVL树需要维护节点的平衡因子,高度差比较小,导致相对红黑树来说更加占用空间。
6、HashMap为什么要链表长度到8才转红黑树
1)问题一:JDK1.8的HashMap,为什么链表的长度达到8的时候才会转红黑树?
因为在理想情况下,链表长度符合泊松分布,长度很难达到8,树节点使用较少。
2)问题二:为什么是8而不是其他数字?
8是根据概率统计而选择,链表长度为8的概率仅为0.00000006,这是一个小于千万分之一的概率,此时链表的性能已经很差了。
因此在这种比较罕见的情况下,为了查询的性能,HashMap才会将链表转成红黑树,链表转红黑树需要时间和空间。
如下是HashMap源码的解释

7、HashMap为什么不直接使用红黑树
1)树节点所占用的空间是普通节点的2倍,当普通节点足够多的时候才会使用树节点。
2)链表一开始的节点比较少,占用空间也少,查询性能相对也好,当链表越来越长且查询性能下降,为了保证查询效率,才会将链表转成红黑树,以空间换时间。
3)另外,链表很长的情况比较少见,如果一开始就使用红黑树,会导致空间占用相对过大,适得其反。
8、简述HashMap的put()方法逻辑
大致流程如下:
1)调用putVal方法将键值对插入到HashMap。
2)计算键的hash值,如果键为null,则hash值为0。
3)根据hash值找到键值对应的位置,如果HashMap的tab数组为空或长度为0,则需要进行初始化
4)如果该位置已经存在数据,则需要进行链表或红黑树的插入操作。
5)如果存在相同的键(key),则直接用新的值(value)替换旧的值。
6)插入成功,增加modCount和size,如果size超过了阀值,则需要进行扩容。
HashMap的put()方法部分源码与相应的注释如下:
public V put(K key, V value) {
// 1)调用putVal方法将键值对插入到HashMap
return putVal(hash(key), key, value, false, true);
}
// 2)计算键的hash值,如果键为null,则hash值为0
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
// 具体将键值对插入HashMap的主要逻辑
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
Node<K,V>[] tab;
Node<K,V> p;
int n, i;
// 3)根据hash值找到键值对应的位置,如果HashMap的tab数组为空或长度为0,则需要进行初始化
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
// 计算键值对在tab数组的位置,如果该位置没有数据,则直接插入
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
// 4)如果该位置已经存在数据,则需要进行链表或红黑树的插入操作
else {
Node<K,V> e;
K k;
// 如果该位置已经存在相同的键(key),则直接用新的值(value)替换旧的值
if (p.hash == hash
&& ((k = p.key) == key || (key != null && key.equals(k))))
e = p;
// 如果该位置存在TreeNode节点,则将键值对插入红黑树
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
// 如果该位置存在链表,则遍历链表找到合适的位置插入键值对
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
// 如果链表长度超过阀值(8),则将链表转成红黑树
if (binCount >= TREEIFY_THRESHOLD - 1)
treeifyBin(tab, hash);
break;
}
if (e.hash == hash
&& ((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
// 5)如果存在相同的键(key),则直接用新的值(value)替换旧的值
if (e != null) {
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
// 6)插入成功,增加modCount和size,如果size超过了阀值,则需要进行扩容
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
9、简述HashMap的get()方法逻辑
大致流程如下:
1)调用getNode方法查找指定键(key)的节点并返回值(value)。
2)根据hash值和键找到对应的节点。
3)如果tab数组为空或不存在要查找的键,就返回null。
HashMap的get()方法部分源码与相应的注释如下:
public V get(Object key) {
Node<K,V> e;
// 1)调用getNode方法查找指定键(key)的节点并返回值(value)
return (e = getNode(hash(key), key)) == null ? null : e.value;
}
final Node<K,V> getNode(int hash, Object key) {
Node<K,V>[] tab;
Node<K,V> first, e;
int n;
K k;
// 2)根据hash值和键找到对应的节点
// 如果tab数组不为null,则从tab数组中的对应位置开始查找
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
// 如果第一个节点就是要查找的节点则直接返回
if (first.hash == hash &&
((k = first.key) == key || (key != null && key.equals(k))))
return first;
// 如果第一个节点不是要查找的节点,则从链表或红黑树中查找
if ((e = first.next) != null) {
if (first instanceof TreeNode)
return ((TreeNode<K,V>)first).getTreeNode(hash, key);
do {
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
// 3)如果tab数组为空或不存在要查找的键,就返回null
return null;
}
本文详细介绍了JDK1.8中HashMap的数据结构变化,包括使用对象作为键的要求、红黑树的引入及其原因,以及put()和get()方法的逻辑。重点讨论了为何在链表长度达到8时转为红黑树和为什么不直接使用AVL树的问题。
3431

被折叠的 条评论
为什么被折叠?



