文章目录
一、hashmap的数据结构
底层数组+单向链表,jdk1.8后,链表长度大于8,并且数组长度大于64,将转为用红黑树存储
二、hashmap用了hash为什么还要equals
因为hash也会重复,hash重复但是值不一定相等,所以要使用equals进行判断
三、hashmap中put方法的过程
- 计算hash值, key.hashCode()>>>16,用高16位和低16位进行异或运算(二进制按位比较,如果相同则为 0,不同则为 1)。
- 然后根据hash值计算出数组下标(跟数组长度进行与运算),将元素放入数组中,如果没有出现哈希冲突,则直接放入数组,如果出现哈希冲突,则以链表的方式放在链表最后(jdk1.7使用头插法,也就是放在链表最前面,jdk1.8使用了尾插法,放在了链表最后面)。
- 如果链表的长度超过8,并且数组长度大于64,就把链表转成红黑树,如果链表长度低于6,就把红黑树转回链表;
- 如果数组中键值对的总量超过了阈值(负载因子0.75),会进行动态扩容。
四、负载因子是什么
负载因子用来实现hashmap动态扩容,默认0.75是在时间和空间上折中的一个选择。
扩容阈值计算公式:threshold = capacity * loadFactor (capacity是数组容量,初始化默认16,loadFactor是负载因子,初始化默认0.75)
负载因子对hashmap的影响
- 负载因子越大,意味着容器中元素存得越满,虽然节省了空间,但是也增加了元素哈希冲突的概率
- 负载因子越小,容器中空余的位置越多,虽然减少了元素哈希冲突的概率,但也造成了大量的空间浪费
默认的负载因子 DEFAULT_LOAD_FACTOR = 0.75,这是 jdk 设置的一个比较合适的负载因子,一般情况下不推荐去修改它。特殊情况下:
- 对内存空间要求比较苛刻,而对元素查找速度要求不高,可以把负载因子调高(时间换空间)
- 对程序运行速度要求苛刻,而内存空间充足的情况,可以把负载因子调低(空间换时间)
五、hash冲突有什么解决方式
-
开放定址法:当冲突发生时,使用某种探查(探测)技术再散列表中形成一个探查(探测)序列。沿此序列逐个单元的查找,直到找到给定的关键字,或者碰到一个开放的地址(地址单元为空)为止。
- 线性探查法
- 线性补偿探测法
- 随机探测
-
链地址法(拉链法):将所有冲突的值,都存到同一个链表里。(HashMap就是用的这种方式)
-
再哈希法:当发生冲突时,使用第二个、第三个…等哈希函数计算地址,一直到不冲突为止。
-
公共溢出区:将哈希表分为基本表和溢出表两部分,凡是和基本表发生冲突的元素,都记录到溢出表。