HashMap 底层源码解读(一行一行读,有基础就能看懂)

HashMap 底层源码解读(源码分析+知识问答)

源码图解

请添加图片描述

什么是哈希碰撞?或者什么是哈希冲突?为什么会发生哈希冲突?

不同的关键字通过相同的哈希函数算出了一个相同的 哈希地址,这就叫做哈希冲突。

哈希冲突主要因为 哈希表底层的数组容量是小于实际存储的关键字的数量,所以发生冲突是必然的,我们只能够尽量避免,不能完全消除。

如何设计哈希函数?你了解哈希函数怎么设计吗?

引起哈希冲突的一个方面就是哈希函数设计的不够合理。哈希函数设计的越精妙,产生哈希冲突的可能性就越低,但是无法避免哈希冲突

设计哈希函数我们的原则是

1.降低碰撞和溢出的产生

2.哈希函数设计简单

3.函数计算的地址尽量均与分布在整个空间提高空间利用率。

常见的哈希函数

常见的哈希函数,可以说出来两三个,随便解释一下

除留余数法

设置散列表中允许的地址数为m,取一个不大于m,但是接近于m或者等于m 的质数p作为除数,按照哈希函数:

Hash(key) = key%p ,将关键字转换成哈希地址

直接定址法

计算关键字的某个线性函数得到哈希地址

Hash(key) = A*key+B

优点: 设计简单、均匀分布

缺点:需要事先知道关键字的分布情况

适用的场景:查找比较小且连续的情况

如何避免哈希冲突?

1.设计更合理的哈希函数

哈希函数设计的越精妙,产生冲突的概率就越低。

2.调节负载因子

什么是负载因子,负载因子就是 填入表中的元素数量/散列表的长度

在这里插入图片描述

负载因子和冲突率的关系是成正比的,因为填入表中的元素不能够改变,所以我们只能调节数组的长度。

所以降低冲突率,就是降低负载因子的大小,因此我们只能够把增大散列表的长度(到达阈值扩容)来降低冲突率。

为什么HashMap 的负载因子 loadFactor大小为0.75?

作用很简单,相当于是一个扩容机制的阈值。当超过了这个阈值,就会触发扩容机制。HashMap源码已经为我们默认指定了负载因子是0.75。

当前的容器容量是16,负载因子是0.75;16*0.75=12,也就是说,当容量达到了12的时就会执行扩容操作。

负载因子为1.0的情况

当负载因子是1.0时,也就意味着,只有当数组所有值全部填充了,才会发生扩容。这就带来了很大的问题,因为Hash冲突时避免不了的。

后果:当负载因子是1.0的时候,意味着会出现大量的Hash的冲突。对于查询效率极其不利。这种情况就是牺牲了时间来保证空间的利用率。

因此一句话总结就是负载因子过大,虽然空间利用率上去了,但是时间效率降低了。

负载因子是0.5的情况

负载因子是0.5的时候,这也就意味着,当数组中的元素达到了一半就开始扩容,既然填充的元素少了,Hash冲突也会减少,那么底层的链表长度或者是红黑树的高度就会降低。查询效率就会增加。

但是,此时空间利用率就会大大的降低,原本存储1M的数据,现在就意味着需要2M的空间。

总之,就是负载因子太小,虽然时间效率提升了,但是空间利用率降低了。

负载因子是0.75的情况

负载因子是0.75的时,空间利用率比较高,而且避免了相当多的Hash冲突,提高了时间查找效率,所以 负载因子是 0.75 体现了时间和空间的权衡。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

RAIN 7

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值