一、HashMap 底层原理

一、HashMap 底层原理

在这里插入图片描述

  • HashMap 基于哈希表的 Map 接口实现,是以 key-value 存储形式存在,即主要用来存放键值对。HashMap 的实现不是同步的,这意味着它不是线程安全的。它的 key、value 都可以为 null,此外,HashMap 中的映射不是有序的。

  • jdk1.8 之前 HashMap 由 数组 + 链表 组成,数组是 HashMap 的主体,链表则是主要为了解决哈希冲突(两个对象调用的 hashCode 方法计算的哈希值一致导致计算的教组索引值相同)而存在的(“拉链法”解决冲突)。jdk1.8 以后在解决哈希冲突时有了较大的变化,当链表长度大于阈值(或者红黑树的边界值,默认为 8 )并且当前数组的长度大于64时,此时此索引位置上的所有数据改为使用红黑树存储。

  • 补充:将链表转换成红黑树前会判断,即便阈值大于8,但是数组长度小于64,此时并不会将链表变为红黑树,而是选择逬行数组扩容。

    这样做的目的是因为数组比较小,尽量避开红黑树结构,这种情况下变为红黑树结构,反而会降低效率,因为红黑树需要逬行左旋,右旋,变色这些操作来保持平衡。同时数组长度小于64时,搜索时间相对要快些。所以结上所述为了提高性能和减少搜索时间,底层阈值大于8并且数组长度大于64时,链表才转换为红黑树,具体可以参考 treeifyBin() 方法。

    当然虽然增了红黑树作为底层数据结构,结构变得复杂了,但是阈值大于8并且数组长度大于64时,链表转换为红黑树时,效率也变的更高效。

  • 小结:

    HashMap 特点:

    1. 存储无序的。

    2. 键和值位置都可以是 null,但是键位置只能存在一个 null。

    3. 键位置是唯一的,是底层的数据结构控制的。

    4. jdk1.8 前数据结构是链表+数组,jdk1.8 之后是链表+数组+红黑树

    5. 阈值(边界值)> 8 并且数组长度大于 64,才将链表转换为红黑树,变为红黑树的目的是为了高效的查询。

1.1 hashmap和hashtable的区别
HashMapHashTable说明
无序的无序的
HashMap继承了AbstractMap抽象类HashTable继承了Dictionary抽象类父类不同
HashMap 允许一个空键(其他的空键会覆盖第一个空键)和 任意数量 的NULLHashTable *不允许NULL值(包括键或值)<key, value>NULL区别
方法是异步的(即,线程不安全,效率较高方法是同步的(即,线程安全的,效率较低HashTableHashMap最主要的区别。 如果对同步性没有要求,建议使用HashMap。 看HashTable的源码(,除构造函数外,HashTable的所有 public 方法声明中都有 synchronized关键字,而HashMap的源码中则没有。
HashMap去掉了HashTablecontains()方法,但是加上了containsValue()containsKey()方法
HashMaphash数组的默认大小是16,而且一定是2的指数HashTablehash数组默认大小是11,增加的方式是 old * 2 + 1

相同点

HashMap & HashTable
HashMapHashTable的底层实现都是数组 + 链表实现
HashMapHashTable的数据元素是无序的
为了成功地在HashMapHashTable中存储和获取对象,用作key的对象必须实现hashCode()方法和equals()方法
### HashMap 底层数据结构 HashMap底层结构采用 **数组 + 链表/红黑树** 的方式实现。这种结构结合了数组的快速访问特性和链表/红黑树在冲突处理中的高效性。HashMap 通过哈希函数将键(key)转换为哈希值,然后根据哈希值计算出键值对在数组中的存储位置(索引)[^2]。 - **数组**:用于存储数据的主结构,数组的每个元素被称为“桶”(bucket)。 - **链表**:当多个键值对被映射到同个桶时,使用链表来存储这些冲突的键值对。 - **红黑树**:当某个桶中的链表长度超过定阈值(默认为8),链表会转换为红黑树以提升查找效率[^2]。 ### HashMap 的实现原理 HashMap 的核心实现原理围绕 **哈希算法** 和 **冲突解决机制** 展开: 1. **哈希算法**:HashMap 使用键的 `hashCode()` 方法结合扰动函数生成最终的哈希值。通过 `(n - 1) & hash` 计算出键值对的存储位置,其中 `n` 是数组的长度。这种方式确保哈希值均匀分布,减少碰撞概率[^5]。 2. **冲突解决**:当两个不同的键经过哈希计算后映射到相同的桶时,会发生哈希冲突。HashMap 使用 **拉链法** 解决冲突,即在每个桶中维护个链表,存储所有冲突的键值对。当链表长度超过阈值时,链表会转换为红黑树以提升性能。 3. **动态扩容**:当 HashMap 中的元素数量接近其容量与负载因子(默认为0.75)的乘积时,HashMap 会自动扩容(通常是当前容量的两倍),并重新分配所有键值对到新的桶中。这个过程称为 **再哈希**(rehash)[^5]。 4. **线程安全性**:HashMap 不是线程安全的,在多线程环境下可能会导致数据不致或死循环等问题。如果需要线程安全的实现,可以使用 `ConcurrentHashMap`[^3]。 ### 示例代码:HashMap 的基本使用 ```java import java.util.HashMap; public class HashMapExample { public static void main(String[] args) { // 创建HashMap 实例 HashMap<String, Integer> map = new HashMap<>(); // 添加键值对 map.put("Apple", 10); map.put("Banana", 20); map.put("Orange", 30); // 获取值 System.out.println("Apple: " + map.get("Apple")); // 输出 Apple: 10 // 遍历 HashMap for (String key : map.keySet()) { System.out.println(key + ": " + map.get(key)); } // 删除键值对 map.remove("Banana"); // 检查是否包含某个键 if (map.containsKey("Orange")) { System.out.println("Contains Orange"); } } } ``` ### 性能优化与使用场景 HashMap 的性能优势主要体现在 **快速的插入、查找和删除操作**,其平均时间复杂度为 O(1)。这种高效性得益于哈希算法的均匀分布和冲突处理机制的优化(链表转红黑树)。 在实际开发中,HashMap 被广泛用于缓存、索引、快速查找等场景。例如,在金融领域中,HashMap 和 `ConcurrentHashMap` 被频繁用于处理高并发的数据存储和访问需求[^3]。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值