关于java和scala当中HashMap的原理总结

HashMap基于哈希表实现,JDK1.8后采用数组+链表/红黑树结构。put方法通过key的hashCode定位位置,冲突则通过equals比较;get方法同样依赖hashCode和equals获取值。当元素超过容量*负载因子(默认0.75)时,HashMap会扩容,可能导致性能开销。创建时可预估大小以避免后续扩容。转化阈值如TREEIFY_THRESHOLD为8,UNTREEIFY_THRESHOLD为6,MIN_TREEIFY_CAPACITY为64,确保高效运行。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

HashMap是基于数据结构哈希表的原理,在jdk1.8之前底层的存储结构是数组加链表,在jdk1.8包括1.8之后存储结构是数组加链表或者红黑树。

1、put():当调用put方法往hashmap里存放对象的时候,首先会将这个key-value键值对实例化成一个Entry对象,然后会调用key的hashCode()方法,取得hash值之后,会根据hash值与数组的长度取模的结果找到其应该存放的位置,放的时候,会先检查对应的位置有没有数据,如果没有,直接放入,如果有的话,会调用两个key的equals()方法,如果返回true,那么新的value会覆盖原来的value,如果返回false,那么会将这个Entry与原来的Entry形成一个链,也就是链表,并且新的Entry会放在链表的头部

2、get():当调用get方法时,会先调用key的hashCode()方法,找到其存在的位置,然后再调用key的equals()方法,找到其对应的Entry,将value取出

3、resize():当数据越来越多的时候意味着碰撞的几率越来越高,碰撞的几率高的话,意味着查询的效率下降,所以hashmap又提供了数组扩容的方法(hashmap的默认长度是16),当数据长度超过hashmap的长度*loadFactor(loadFactor默认是0.75)的时候,hashmap的长度会扩大一倍,但当长度扩大的时候,意味着要重新计算每个元素在数组中的位置,这是一个非常耗费性能的操作,所以当创建hashmap对象的时候,如果已知数据量的多少,比如数据的长度是1000,可以通过new HashMap(1000)来解决,其实1000和1024是一样的,都会开辟1024个空间,但要主要,是超过数组长度的0.75的时候就会扩容,所以应该new HashMap(2048),这样子便可以一次性创建,防止后续的扩容问题

 

注意一下几个属性

//链表转换成树的阈值 
static final int TREEIFY_THRESHOLD = 8; 
//树转换成链表的阈值(执行resize操作时,当桶中bin的数量少于UNTREEIFY_THRESHOLD时使用链表来代替树) 
static final int UNTREEIFY_THRESHOLD = 6; 
//在转变成树之前,还会有一次判断,只有键值对数量大于 64 才会发生转换。 
//这是为了避免在哈希表建立初期,多个键值对恰 好被放入了同一个链表中而导致不必要的转化。 
static final int MIN_TREEIFY_CAPACITY = 64;

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值