HashMap 底层源码解读（一行一行读，有基础就能看懂）

最新推荐文章于 2025-05-30 09:02:08 发布

原创

最新推荐文章于 2025-05-30 09:02:08 发布 · 6.8k 阅读

·

29

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

文章目录

HashMap 底层源码解读(源码分析+知识问答)

源码图解

请添加图片描述

什么是哈希碰撞？或者什么是哈希冲突？为什么会发生哈希冲突？

不同的关键字通过相同的哈希函数算出了一个相同的哈希地址，这就叫做哈希冲突。

哈希冲突主要因为哈希表底层的数组容量是小于实际存储的关键字的数量，所以发生冲突是必然的，我们只能够尽量避免，不能完全消除。

如何设计哈希函数？你了解哈希函数怎么设计吗？

引起哈希冲突的一个方面就是哈希函数设计的不够合理。哈希函数设计的越精妙，产生哈希冲突的可能性就越低，但是无法避免哈希冲突

设计哈希函数我们的原则是

1.降低碰撞和溢出的产生

2.哈希函数设计简单

3.函数计算的地址尽量均与分布在整个空间提高空间利用率。

常见的哈希函数

常见的哈希函数，可以说出来两三个，随便解释一下

除留余数法

设置散列表中允许的地址数为m，取一个不大于m，但是接近于m或者等于m 的质数p作为除数，按照哈希函数：

Hash(key) = key%p ，将关键字转换成哈希地址

直接定址法

计算关键字的某个线性函数得到哈希地址

Hash(key) = A*key+B

优点：设计简单、均匀分布

缺点：需要事先知道关键字的分布情况

适用的场景：查找比较小且连续的情况

如何避免哈希冲突？

1.设计更合理的哈希函数

哈希函数设计的越精妙，产生冲突的概率就越低。

2.调节负载因子

什么是负载因子，负载因子就是填入表中的元素数量/散列表的长度

在这里插入图片描述

负载因子和冲突率的关系是成正比的，因为填入表中的元素不能够改变，所以我们只能调节数组的长度。

所以降低冲突率，就是降低负载因子的大小，因此我们只能够把增大散列表的长度（到达阈值扩容）来降低冲突率。

为什么HashMap 的负载因子 loadFactor大小为0.75？

作用很简单，相当于是一个扩容机制的阈值。当超过了这个阈值，就会触发扩容机制。HashMap源码已经为我们默认指定了负载因子是0.75。

当前的容器容量是16，负载因子是0.75；16*0.75=12，也就是说，当容量达到了12的时就会执行扩容操作。

负载因子为1.0的情况

当负载因子是1.0时，也就意味着，只有当数组所有值全部填充了，才会发生扩容。这就带来了很大的问题，因为Hash冲突时避免不了的。

后果：当负载因子是1.0的时候，意味着会出现大量的Hash的冲突。对于查询效率极其不利。这种情况就是牺牲了时间来保证空间的利用率。

因此一句话总结就是负载因子过大，虽然空间利用率上去了，但是时间效率降低了。

负载因子是0.5的情况

负载因子是0.5的时候，这也就意味着，当数组中的元素达到了一半就开始扩容，既然填充的元素少了，Hash冲突也会减少，那么底层的链表长度或者是红黑树的高度就会降低。查询效率就会增加。

但是，此时空间利用率就会大大的降低，原本存储1M的数据，现在就意味着需要2M的空间。

总之，就是负载因子太小，虽然时间效率提升了，但是空间利用率降低了。

负载因子是0.75的情况

负载因子是0.75的时，空间利用率比较高，而且避免了相当多的Hash冲突，提高了时间查找效率，所以负载因子是 0.75 体现了时间和空间的权衡。

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

RAIN 7 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。