Java集合干货——HashMap源码分析

本文详细分析了Java集合类HashMap的源码,包括HashMap的基本概况、非线程安全的原因、与Hashtable的区别、put操作的实现、哈希表碰撞攻击及扩容机制。通过阅读源码,深入了解HashMap的工作原理和优化策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

似乎所有的java面试或者考察都绕不开hash,准确说是必问集合,问集合必问hash表。

 

虽然一直以来都经常的使用HashMap,但是却一直没有看过源码,可能是没有意识到阅读源码的好处,经过分析,发现阅读源码让自己对集合有了更加深刻的了解,因此会一直将这个系列进行下去,这次要说的是HashMap。

 

 

 

HashMap的基本概况

HashMap是一个Hash表,其数据以键值对的结构进行存储,在遇到冲突的时候会使用链表来进行解决,JDK8以后引入了红黑树的模式,具体会在文中分析。

 

其次,HashMap是非线程安全的,Key和Value都允许为空,Key重复会覆盖、Value允许重复。

 

补充一句,在多线程下我们可以使用concurrentHashMap。

 

HashMap和Hashtable的区别:

(HashMap和Hashtable)

 

HashMap定义

public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable

HashMap没有什么要说的,直接切入正题,初始化一个HashMap。

 

初始化

HashMap map = new HashMap();

通过这个方法会调用HashMap的无参构造方法。

//两个常量 向下追踪
public HashMap() {
  this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR);
}

//无参构造创建对象之后 会有两个常量
//DEFAULT_INITIAL_CAPACITY 默认初始化容量 16  这里值得借鉴的是位运算
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
//DEFAULT_LOAD_FACTOR 负载因子默认为0.75f 负载因子和扩容有关 后文详谈
static final float DEFAULT_LOAD_FACTOR = 0.75f;

//最大容量为2的30次方
static final int MAXIMUM_CAPACITY = 1 << 30;

//以Node<K,V>为元素的数组,长度必须为2的n次幂
transient Node<K,V>[] table;

//已经储存的Node<key,value>的数量,包括数组中的和链表中的,逻辑长度
transient int size;

threshold 决定能放入的数据量,一般情况下等于 Capacity * LoadFactor

 

通过上述代码我们不难发现,HashMap的底层还是数组(注意,数组会在第一次put的时候通过 resize() 函数进行分配),数组的长度为2的N次幂。

 

在HashMap中,哈希桶数组table的长度length大小必须为2的n次方(一定是合数),这是一种非常规的设计,常规的设计是把桶的大小设计为素数。

 

相对来说素数导致冲突的概率要小于合数,Hashtable初始化桶大小为11,就是桶大小设计为素数的应用(Hashtable扩容后不能保证还是素数)。

 

HashMap采用这种非常规设计,主要是为了在取模和扩

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值