注意:
源码的精髓都在第三点耐着性子会有收获的(也可以去b站看阿伟的javase下部hashmap原码)
1,基本数据结构
-
1.7 数组 + 链表
-
1.8 数组 + (链表 | 红黑树) // 链表和红黑树是在特定的条件下是可以相互转换的
2,数据节点
数组和链表的节点都是Node<K,V>(HashMap的静态内部类)实现了Map.Entry<K,V> 接口
hashMap里面的红黑树是TreeNode节点类 这个节点继承了LinkedHashMap.Entry<K,V>;;;同时Entry<K,V>又继承了HashMap.Node<K,V>
说白了就是key-value以节点类实例存放
3,扩容机制+底层数据结构(重点)
// aka 16 ==>默认容量
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
//在构造函数中未指定任何内容时使用的荷载系数 当数据的长度达到容量的3/4时候扩容为原来的两倍
static final float DEFAULT_LOAD_FACTOR = 0.75f;
//当数组元素下面挂着的链表的长度大于8时调用 treeifyBin(tab, hash)操作
static final int TREEIFY_THRESHOLD = 8;
//第一次使用put函数-->构建hashMap底层的数据结构
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
/*
成员变量是保存在堆的
方法是运行在栈里面的
*/
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {
//定义一个局部变量,用来记录哈希表中数组的地址值。//防止运行在栈里面的方法一直访问堆里面的成员变量
Node<K,V>[] tab;
//临时的第三方变量,用来记录键值对对象的地址值
Node<K,V> p;
//表示当前数组的长度
int n;
//表示索引
int i;
//把哈希表中数组的地址值,赋值给局部变量tab
tab = table;
if (tab == null || (n = tab.length) == 0){
//1.如果当前是第一次添加数据,底层会创建一个默认长度为16,加载因子为0.75的数组
//2.如果不是第一次添加数据,会看数组中的元素是否达到了扩容的条件
//如果没有达到扩容条件,底层不会做任何操作
//如果达到了扩容条件,底层会把数组扩容为原先的两倍,并把数据全部转移到新的哈希表中
tab = resize();
//表示把当前数组的长度赋值给n
n = tab.length;
}
//拿着数组的长度跟键的哈希值进行(二进制与)运算,计算出当前键值对有应该在数组中的索引
i = (n - 1) & hash;//index
//获取数组中对应元素的数据
p = tab[i];
if (p == null){
//底层会创建一个键值对对象,直接放到数组当中
tab[i] = newNode(hash, key, value, null);
}else {
Node<K,V> e;
K k;
//等号的左边:数组中键值对的哈希值
//等号的右边:当前要添加键值对的哈希值
//如果键不一样,此时返回false
//如果键一样,返回true
boolean b1 = p.hash == hash;
if (b1 && ((k = p.key) == key || (key != null && key.equals(k)))){
e = p;
} else if (p instanceof TreeNode){
//判断数组中获取出来的键值对是不是红黑树中的节点
//如果是,则调用方法putTreeVal,把当前的节点按照红黑树的规则添加到树当中。
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
} else {
//如果从数组中获取出来的键值对不是红黑树中的节点
//表示此时下面挂的是链表
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
//此时就会创建一个新的节点,挂在下面形成链表
p.next = newNode(hash, key, value, null);
//判断当前链表长度是否超过8,如果超过8,就会调用方法treeifyBin
if (binCount >= TREEIFY_THRESHOLD - 1)
//treeifyBin方法的底层还会继续判断
//判断数组的长度是否大于等于64
//如果同时满足这两个条件,就会把这个链表转成红黑树
//不然他只会在底层看是否满足口扩容机制
treeifyBin(tab, hash);
break;
}
//e: 0x0044 ddd 444
//要添加的元素: 0x0055 ddd 555
//如果哈希值一样,就会调用equals方法比较内部的属性值是否相同
if (e.hash == hash && ((k = e.key) == key || (key != null &&key.equals(k)))) {break;}
p = e;
}
}
//如果e为null,表示当前不需要覆盖任何元素
//如果e不为null,表示当前的键是一样的,值会被覆盖(也就是说原节点的地址是不会变化的)
//e:0x0044 ddd 555
//要添加的元素: 0x0055 ddd 555
if (e != null) {
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null){
//等号的右边:当前要添加的值
//等号的左边:0x0044的值
e.value = value;
}
afterNodeAccess(e);
return oldValue;
}
}
//threshold:记录的就是数组的长度 * 0.75,哈希表的扩容时机 16 * 0.75 = 12
if (++size > threshold){
resize();
}
//表示当前没有覆盖任何元素,返回null
return null;
}
4,效率
由于hashmap的数据结构在数据量不大的情况下是数组+链表,所以程序可以通过对key的hash与数组的长度做与运算快速定位到索引位置-->效率是非常快的
5,线程不安全
在并发的情况下hashmap是线程不安全的,线程安全的集合有Hashtable,ConcurrentHashMap..
如果业务量的并发量不高也就不用考虑了,