HashMap原理解析

最新推荐文章于 2024-05-29 19:10:43 发布

嗷嗷待哺丶

最新推荐文章于 2024-05-29 19:10:43 发布

阅读量1.2k

点赞数 4

分类专栏：笔记文章标签：哈希算法数据结构 java

本文链接：https://blog.youkuaiyun.com/qq_15505769/article/details/121031024

版权

HashMap基于数组+链表/红黑树实现，通过hash和equals避免冲突。put过程涉及hash计算、链表/红黑树转换。负载因子0.75用于平衡空间和时间。解决冲突方式包括开放寻址法和链地址法（HashMap采用）。JDK1.8后，长度超8的链表转为红黑树，提高查询效率。容量必须为2的n次幂，降低碰撞。扩容时，旧节点通过(e.hash & oldCap) == 0判断是否需要移位。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

一、hashmap的数据结构

底层数组+单向链表，jdk1.8后，链表长度大于8，并且数组长度大于64，将转为用红黑树存储

二、hashmap用了hash为什么还要equals

因为hash也会重复，hash重复但是值不一定相等，所以要使用equals进行判断

三、hashmap中put方法的过程

计算hash值， key.hashCode()>>>16，用高16位和低16位进行异或运算（二进制按位比较，如果相同则为 0，不同则为 1）。
然后根据hash值计算出数组下标（跟数组长度进行与运算），将元素放入数组中，如果没有出现哈希冲突，则直接放入数组，如果出现哈希冲突，则以链表的方式放在链表最后（jdk1.7使用头插法，也就是放在链表最前面，jdk1.8使用了尾插法，放在了链表最后面）。
如果链表的长度超过8，并且数组长度大于64，就把链表转成红黑树，如果链表长度低于6，就把红黑树转回链表；
如果数组中键值对的总量超过了阈值（负载因子0.75），会进行动态扩容。

四、负载因子是什么

负载因子用来实现hashmap动态扩容，默认0.75是在时间和空间上折中的一个选择。

扩容阈值计算公式：threshold = capacity * loadFactor （capacity是数组容量，初始化默认16，loadFactor是负载因子，初始化默认0.75）

负载因子对hashmap的影响

负载因子越大，意味着容器中元素存得越满，虽然节省了空间，但是也增加了元素哈希冲突的概率
负载因子越小，容器中空余的位置越多，虽然减少了元素哈希冲突的概率，但也造成了大量的空间浪费

默认的负载因子 DEFAULT_LOAD_FACTOR = 0.75，这是 jdk 设置的一个比较合适的负载因子，一般情况下不推荐去修改它。特殊情况下：

对内存空间要求比较苛刻，而对元素查找速度要求不高，可以把负载因子调高（时间换空间）
对程序运行速度要求苛刻，而内存空间充足的情况，可以把负载因子调低（空间换时间）

五、hash冲突有什么解决方式

开放定址法：当冲突发生时，使用某种探查（探测）技术再散列表中形成一个探查（探测）序列。沿此序列逐个单元的查找，直到找到给定的关键字，或者碰到一个开放的地址（地址单元为空）为止。
- 线性探查法
- 线性补偿探测法
- 随机探测
链地址法（拉链法）：将所有冲突的值，都存到同一个链表里。（HashMap就是用的这种方式）
再哈希法：当发生冲突时，使用第二个、第三个…等哈希函数计算地址，一直到不冲突为止。
公共溢出区：将哈希表分为基本表和溢出表两部分，凡是和基本表发生冲突的元素，都记录到溢出表。