HashSet集合

本文介绍了HashSet集合的工作原理,包括如何通过计算hash值来进行高效的数据存储与检索。探讨了单链表解决hash冲突的方法,并对比了HashSet与数组集合在检索速度上的差异。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

HashSet集合:

hashSet集合是把存储进来的对象先计算出对象的hash值后才进行对应的存储,因为存储进来的对象都有一个hash值,所以在进行查询的时候不需要像其他集合一样,一个个去查询来得到所需要的对象。hashSet集合只需要把要查询的对象计算出hash值后查找存储区域里hash值一样的对象,然后拿出来即可。这样检索速度就会相当快,这也是hashSet集合的优点。

 

hashSet集合里如果存储对象时出现两个或多个相同的hash值,则会以单链的形式挂在同一个hash值下,所以数组的长度越长检索的速度越快,因为数据分开的比较散不会挤在一起。如果数组太短的话存储的对象就会拥挤在同一个hash值下,这样检索起来自然会慢很多。

 

HashSet集合与数组集合检索速度对比:

数组集合检索:

93443ed2905030139036ae6e288153f8.png


HashSet集合检索:

9f5a2c46358677c8a492f4bc3080aa8c.png


速度对比:

f84ccd0b22189103b39e10cd660bec64.png


运行结果:

695358ff6c8526beab6b42e012a63499.png

从以上实验可以看得出速度相差的不是一点点。




单链引用示意图:

e7246db151be6a7edaa6a8a24222b293.png



数组存储示意图:

30231967baca1da0cc9466ddbb650779.png




HashSet集合添加方法:

代码示例:

4456bce858d8bdf7b32f757dc765df2d.png

5d1c7b01ffa69a596a44583c08b298f2.png




本文转自 ZeroOne01 51CTO博客,原文链接:http://blog.51cto.com/zero01/1976545,如需转载请自行联系原作者

### Java `HashSet` 底层实现原理 #### 数据结构与内部机制 Java 中的 `HashSet` 是基于哈希表(Hash Table)的数据结构来存储元素。具体来说,`HashSet` 的底层是由 `HashMap` 实现的[^1]。 当创建一个新的 `HashSet` 对象时,实际上是在背后初始化了一个 `HashMap` 来保存所有的元素。在这个过程中,`HashSet` 使用对象作为键而对应的值是一个静态的对象实例 `PRESENT` (通常定义为 `private static final Object PRESENT = new Object()`) 。因此,在向 `HashSet` 添加元素的时候,实际上是调用了 `HashMap` 的 `put(key, value)` 方法[^2]。 对于给定的例子: ```java public class HashSet_Type { public static void main(String[] args) { HashSet<String> hashSet = new HashSet<>(); hashSet.add("java"); hashSet.add("php"); hashSet.add("java"); System.out.println(hashSet); //[java, php] } } ``` 这段代码展示了如何使用 `HashSet` 并尝试添加重复项 `"java"` ,但由于 `HashSet` 不允许有重复元素,所以最终只保留了一份 `"java"` 和另一份不同的字符串 `"php"` 。 #### 哈希冲突处理方式 由于多个不同对象可能具有相同的哈希码,这就会引发所谓的“哈希碰撞”。为了应对这种情况,`HashMap` (进而影响到 `HashSet`)采用了链地址法(Separate Chaining),即在发生哈希冲突的位置上构建一个单向链表或者红黑树(当桶中的节点数量超过一定阈值时会自动转换成红黑树以提高查找效率)。这意味着即使两个或更多对象映射到了同一个位置,它们仍然可以被正确地区分并存取[^3]。 #### 初始化容量和加载因子 `HashSet` 构造函数接受可选参数用于指定初始容量以及负载因子。这些设置决定了何时应该扩展底层数组大小以保持性能最优。默认情况下,如果未提供特定配置,则采用的是 `0.75f` 的装载因子和 `16` 的起始容量。这种设计是为了平衡时间和空间复杂度之间的关系,使得大多数操作都能接近 O(1),但在最坏的情况下可能会退化至 O(n)。 ```python def __init__(self, initial_capacity=16, load_factor=0.75): self.capacity = initial_capacity self.load_factor = load_factor ... ``` 请注意上述 Python 伪代码仅用来示意,并不是实际 Java 源码的一部分。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值