JDK源码阅读之HashMap -- hash值计算方式、下标查找及tableSizeFor方法

最新推荐文章于 2025-10-23 18:04:09 发布

原创最新推荐文章于 2025-10-23 18:04:09 发布 · 5.1k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#java #jdk #hashmap #源码 #hash

Java 专栏收录该内容

6 篇文章

订阅专栏

本文解析了HashMap中的散列计算方式，包括如何通过hashCode减少碰撞，以及如何利用位运算确保散列值分布均匀。

1. HashMap中的hash计算方式(为什么)

减少hash是的碰撞

2. 下表查找(和hash值的关系)

hashcode ^ (hashcode >>> 16)，让低16位同时包含了高位和低位的信息，在计算下标时，由于高位和低位的同时参与，减少hash的碰撞。

(n - 1) & hashCode：n - 1 使得低位全为1，高位全为0，位与之后的结果一定在0 ---> n-1范围内

发展过程：

1. put到HashMap中的Object，我们视为它合理的实现了hashCode方法，该方法可以达到良好的散列效果，即碰很少重复

2. 既然hashCode合理，我们就可以考虑用它来散列(分桶)对象

3. 由于需要将对象散列到一定编号范围的捅中(0 -- n)，由于n(表大小)是2的整数次方，可以采用n-1和hashcode按位与，得到的结果是在桶范围内，上述我们是hashCode为散列良好的，所以(n -1)&hashCode的计算结果可视为应该分布均匀的。

4. 上述有一个问题，(n -1)&hashCode的计算方式中，假设n=16，那么hashCode其实只有低4位参与了计算，为了进一步降低碰撞的发生，hashCode的计算方式改为了hashcode ^ (hashcode >>> 16)，使得低位中同时包含了低位和高位的信息。

时间问题，暂随意记录，待稍后完善...

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

CaiCaiNeo

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

[JDK8下的HashMap类应用及源码分析] 数据结构、哈希碰撞、链表变红黑树

Java 技术专栏，从入门到精通，熟悉企业级开发

08-30

2340

HashMap是一种基于数组和链表（或红黑树）的数据结构，它通过哈希函数将键映射到数组的一个位置，并在该位置存储一个键值对的节点。 HashMap的put方法在插入数据前，首先要计算键的哈希值（hash(key)）和索引，然后在相应的位置插入或更新节点，如果节点数超过阈值（threshold），就会进行扩容(resize())或树化。 HashMap的get方法主要是根据键的哈希值和索引，找到对应的位置，然后遍历链表或红黑树，返回匹配的值。

JDK1.8---HashMap的resize()扩容方法源码详解

qq_36856024的博客

08-17

4214

JDK1.8---HashMap的resize(）扩容方法源码详解resize()方法触发时机下面开始根据源码介绍HashMap的扩容原理下面进行分步分析扩容 resize()方法触发时机首先总结一下JDK1.8的HashMap都在什么时候触发resize()方法，根据阅读源码总结了三个时机触发扩容，这里只做介绍，后面根据源码详细分析 HashMap是由数组+链表+红黑树构成的，数组就称之为桶了...

2 条评论您还未登录，请先登录后发表或查看评论

hashmap如何得到数组下标

cyt

08-30

4466

1、如何得到数组的下标 > hash 此方法用计算元素的hash值的。简单分析：如果 key是一个空，此时他的 hash 为 0 如果不是空值拿到它的 hashCode 赋给 H 并且与自身的高16位相与计算 static final int hash(Object key) { int h; return key == null ? 0 : (h = key.hashCode()) ^ h >>> 16; } 计算索引下标

HashMap-二进制&计算下标方法刨析

小西瓜皮的博客

09-15

2035

1、HashMap计算下标的方法计算下标源码 Node<K,V>[] tab; Node<K,V> p; int n, i; if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; if ((p = tab[i = (n - 1) & hash]) =...

mbedtls哈希值计算

最新发布

weixin_43358703的博客

10-23

826

哈希值（Hash Value），也被称为哈希码（Hash Code）、散列值（Hash）、摘要（Digest）或指纹（Fingerprint），是将任意长度的消息或数据通过哈希算法（Hash Function）转换成固定长度的数字串。哈希算法是一种单向函数，具有以下重要特性：哈希算法的特性确定性：◦对于相同的输入数据，哈希算法总是产生相同的哈希值。◦ 例如，无论何时使用相同的哈希算法处理相同的输入数据，结果总是相同的。

java--HashMap源码之hash值计算（图解）

JustinQin

05-31

2315

一、学习背景最近在了解HashMap 存储元素的底层原理时，看到其中的hash 算法，运用到了位运算中的按位异或（^）、无符号右移（>>>），重新复习了下位运算的知识体系，文章以整数10和-10为例，进行讲解。 HashMap存储元素底层源码二、图解位运算十转二进制 ...

HashMap中如何计算数组索引下标？

weixin_43811057的博客

11-28

2426

对于key的hashCode做hash操作，无符号右移16位然后做异或运算。还有平方取中法，伪随机数法和取余数法。这三种效率都比较低。而无符号右移16位异或运算效率是最高的。集合中的初始化容量（必须是二的n次幂） //默认的初始容量是16 -- 1<<4相当于1*2的4次方---1*16 static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; 问题：为什么必须是2的n次幂？如果输入值不是2的幂比如10会怎么样？举例分析：

jdk1.8 HashMap哈希表底层采用何种算法计算hash值？如何确定元素在哈希表的下标

浪丶荡

03-23

1241

关键代码取hash 自身hashCode 按位异或hashCode无符号右移16位当数组的长度很短时，只有低位数的hashcode值能参与运算。而让高16位参与运算可以更好的均匀散列，减少碰撞，进一步降低hash冲突的几率。并且使得高16位和低16位的信息都被保留了。 static final int hash(Object key) { int h; return (key == null) ? 0 : (h = key.hashCode()) ^ (h.

jdk1.7之hashMap

Javagoahead的博客

09-02

1533

对于学习hashmap最好的方式就是读懂源码，并且独立进行设计一个hashmap的算法即手写hashMap。jdk1.7中hashmap的数据结构是数组+链表，在其中链表的节点存储的是Entry对象，Entry为一个链表中的一个节点，每个Entry对象都存在这属性：概念图如图：部分问题 1.hashMap初始容量为16的原因需要在效率和内存使用上做一个权衡。这个值不能太大，也不能太小。太小了就可能会频繁的发生扩容，影响效率；太大了又浪费空间，不划算。 2.hashMap的容量为什么是2的n次幂：充分利

阅读 JDK 源码：HashMap 扩容总结及图解

Sumkor的博客

03-01

8140

本文基于 Java8，通过阅读 HashMap 的 resize 方法了解其扩容原理，并对桶上链表的迁移过程进行调试，画图以加深理解。文章目录1. 扩容的时机2. 扩容的源码如果是链结构如果是树结构3. 链表迁移算法执行结果执行过程图示4. 总结 1. 扩容的时机 HashMap 中 put 入第一个元素，初始化数组 table。 HashMap 中的元素数量大于阈值 threshold。 threshold = capacity * load factor。当 size > thresho

HashMap之数组下标计算

Frank-Fu

08-21

3891

HashMap之原理初始化loadFactorcapacitythreshold数组下标计算前提： HashMap是有数组+链表组成的，其中使用的算法有：hash（java8又使用了红黑树）初始化 loadFactor loadFactor是参与计算HashMap扩容的一个加载因子 new HashMap（）会默认给loadFactor加载一个值0.75 capacity capacity并非HashMap的属性，指的是HashMap数组的大小，即table.length threshold

关于HashMap中的hash算法

相忘于江湖

12-21

6399

一、关于Hash表和Hash函数 Hash表也称散列表，直译为哈希表，hash表是一种根据关键字值（key-value）而直接进行访问的数据结构。在哈希表的键值对关系中，key到value中间还存在着一个映射值，这个映射值就是数组的下标index，key正是通过映射到数组对应的下标index而访问到value值的，但key又是如何映射到数组下标的呢？这就要通过一个映射函数f(key)，这个函数我...

HashMap下标计算

TheSoftestGirl的博客

08-03

906

// 计算hash/** static final int hash(Object key) { int h; return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); } put时找到数组下标 i = (n - 1) & hash final V putVal(int hash, K key, V value, boolean onlyIfAbsent,

HashMap中数组下标的计算，为什么HashMap的容量是2的倍数？

qq_52822387的博客

04-24

6486

length-1 为奇数，奇数的二进制最后一位是 1，这样便保证了 hash &(length-1) 的最后一位可能为 0，也可能为 1（这取决于 h 的值），即 & 运算后的结果可能为偶数，也可能为奇数，比如说 9 % 4 = 1，9 的二进制是 1001，4 - 1 = 3，3 的二进制是 0011，9 & 3 = 1001 & 0011 = 0001 = 1。比如说，数组长度是 3，hash 是 7，那么 7 % 3 的结果就是 1，也就是此时可以把元素放在下标为 1 的位置。进行&运算结果为2。

HashMap中对hash值的计算

qq_57865884的博客

08-16

1122

1.同一个对象，在hashMap与TreeMap中的哈希值是一样吗？如何保证hash值的稳定性？2.HashMap的链表长度超过8的时候，会将链表转换成红黑树。但是hashCode分布良好的话，链表的长度符合泊松分布，长度达到8的概率小于千万分之一。hashCode是如何保持分布良好的？使用位运算代替传统的取模运算，加快计算效率将hashCode的高位与地位进行搅动运算，进一步减少哈希冲突。

hashmap查找

weixin_33829657的博客

07-02

270

2019独角兽企业重金招聘Python工程师标准>>> ...

HashMap之Hash解读

长沙要起风了、

02-28

530

HashMap基础源码阅读最近又看了一下hashMap的源码，发现了一些之前没有关注到的内容，比如Hash为什么要这么设计？后续的很多功能都会基于这个Hash算法进行延伸，比如扩容等等，今天重新再来认识一遍hash的算法。首先展示代码: // 构建hash static final int hash(Object key) { int h; return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); } //

HashMap源码中计算数组下标方法，从取余到位与运算。

jiaweizhong的博客

07-01

337

HashMap源码中计算哈希桶索引方法，从取余到位与运算。

集合源码分析 - 阅读HashMap源码（重点：哈希冲突解决、树化阈值） - 对比ConcurrentHashMap实现用IDEA Debug模式跟踪put()流程，记录关键节点 JDK 17源码 + HashMap源码解析文章

03-12

<think>好的，我现在需要深入分析JDK 17中的HashMap和ConcurrentHashMap源码，特别是哈希冲突解决机制、树化阈值和put()方法的工作流程。首先，我得回忆一下HashMap和ConcurrentHashMap的基本结构。根据引用[5]，JDK7的HashMap使用数组加链表的结构，而JDK8引入了红黑树来优化链表过长的问题。树化阈值应该是当链表长度超过一定值时转换成红黑树，这个值应该是8。不过需要确认在JDK17中是否有变化，但根据引用[3]，JDK17的HashMap源码描述中提到红黑树结构，可能树化阈值保持8不变。接下来，哈希冲突解决机制。HashMap使用链地址法，每个数组位置是一个链表或红黑树。当发生哈希冲突时，元素会被添加到链表末尾。当链表长度超过树化阈值，就会转成红黑树。但需要考虑哈希表的容量是否达到最小树化容量（默认64），否则会先扩容而不是树化。这部分需要查看源码中的treeifyBin方法。然后是ConcurrentHashMap的差异。根据引用[1]和[5]，JDK7的ConcurrentHashMap使用分段锁，而JDK8之后改为CAS+synchronized。所以在JDK17中，ConcurrentHashMap的实现应该和JDK8类似，使用Node数组，每个桶的头节点作为锁，通过synchronized同步，结合CAS操作保证线程安全。关于put()方法，HashMap的put流程大致是：计算key的哈希，找到数组下标，如果该位置为空则直接插入；如果是链表则遍历到末尾插入，如果链表长度超过阈值则树化；如果是红黑树则插入树节点。同时，插入后检查容量是否超过负载因子决定的阈值，超过则扩容。而ConcurrentHashMap的put方法使用CAS尝试插入，如果遇到冲突则synchronized锁定头节点，再进行插入，其他步骤类似，但需要考虑并发情况下的线程安全。在IDEA中调试JDK源码可能需要导入JDK的src.zip源码，并设置断点在HashMap和ConcurrentHashMap的put方法相关位置，比如hash方法、putVal方法、treeifyBin方法等，观察变量变化和流程走向。需要验证树化阈值的具体数值，在源码中查找常量定义，比如TREEIFY_THRESHOLD和UNTREEIFY_THRESHOLD，以及MIN_TREEIFY_CAPACITY。根据引用[3]，可能这些常量在JDK17中仍保持8、6和64的值。另外，哈希冲突的解决还涉及哈希函数的设计。HashMap的hash方法可能通过高16位异或低16位来减少碰撞，这在JDK8之后是这样处理的，JDK17应该沿用。而ConcurrentHashMap的哈希计算可能有所不同，需要查看具体实现。总结起来，回答的结构应该先讲HashMap的源码分析，包括结构、哈希冲突处理、树化阈值和put流程，然后对比ConcurrentHashMap的不同之处，尤其是线程安全的实现，最后给出调试建议。需要引用提供的参考文献来支持不同版本的差异，比如JDK7和JDK8的变化，以及JDK17的可能延续。</think>### JDK 17 HashMap 和 ConcurrentHashMap 源码解析 #### 一、HashMap 哈希冲突解决机制 1. **链地址法** HashMap 使用数组+链表/红黑树结构（JDK8+）。当发生哈希冲突时，元素以链表形式存储在相同桶位置，链表长度超过阈值时转为红黑树[^5]。 - 哈希函数：`(key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16)`，通过扰动函数减少碰撞[^3]。 - 树化条件：链表长度 ≥8（`TREEIFY_THRESHOLD`）且数组长度 ≥64（`MIN_TREEIFY_CAPACITY`），否则优先扩容。 2. **扩容机制** 默认负载因子 0.75，扩容时链表节点会重新计算位置（`(e.hash & oldCap) == 0` 决定留在原位置或移动到原位置+oldCap）[^3]。 --- #### 二、HashMap put() 方法流程 1. **计算哈希值** ```java int hash = (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); ``` 2. **定位桶位置** `i = (n - 1) & hash`（n为数组长度）。 3. **处理冲突** - **空桶**：直接插入新节点。 - **链表**：遍历链表，若存在相同key则覆盖值；否则尾部插入。长度≥8时触发树化。 - **红黑树**：调用树节点的插入方法。 4. **扩容检查** 若元素总数超过阈值（容量×负载因子），进行2倍扩容。 ```java // JDK17 HashMap.putVal() 核心逻辑（简化） final V putVal(int hash, K key, V value, boolean onlyIfAbsent) { Node<K,V>[] tab; Node<K,V> p; int n, i; if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; if ((p = tab[i = (n - 1) & hash]) == null) tab[i] = newNode(hash, key, value, null); else { // 处理链表/红黑树插入 if (binCount >= TREEIFY_THRESHOLD - 1) treeifyBin(tab, hash); } if (++size > threshold) resize(); } ``` --- #### 三、ConcurrentHashMap 线程安全实现 1. **JDK8+ 改进** - **分段锁 → 桶锁**：取消分段，改用 `synchronized` 锁单个桶的头节点，结合 CAS 保证原子性[^1]。 - **并发控制**：`sizeCtl` 变量控制初始化与扩容状态，多线程协助扩容。 2. **put() 方法流程** - **CAS 尝试插入**：若桶为空，通过 CAS 写入新节点。 - **锁竞争处理**：若桶非空，使用 `synchronized` 锁住头节点，执行链表/红黑树插入。 - **扩容协助**：插入时检测到正在扩容，当前线程协助迁移数据。 --- #### 四、IDEA 调试 JDK 17 源码 1. **导入源码** 在 IDEA 中关联 `src.zip`（位于 JDK 安装目录）。 2. **关键断点** - `HashMap.putVal()` - `HashMap.treeifyBin()` - `ConcurrentHashMap.putVal()` - `ConcurrentHashMap.transfer()`（扩容逻辑） 3. **观察变量** - `table` 数组结构变化。 - `size` 和 `threshold` 的触发条件。 - 树化阈值 `TREEIFY_THRESHOLD` 和最小树化容量 `MIN_TREEIFY_CAPACITY`。 ---