HashSet

本文深入分析了HashSet类的实现原理,包括其如何基于HashMap提供Set接口功能,探讨了HashSet的构造方法、字段以及非线程安全性特点。同时,文章详细解释了HashSet允许null元素的原因,并对比了常规构造方法与特殊构造方法的区别。

一、顶部注释分析

1.1 从注释中得到的结论

  • This class implements the Set interface, backed by a hash table (actually a HashMap instance):该类实现了 Set 接口,由哈希表进行支持(实际上是 HashMap 的实例)
  • HashSet 不保证迭代的顺序恒久不变
  • HashSet 允许 null 元素 (由于HashMap支持null元素)
  • HashSet 同样是非线程安全的
  • 对 HashSet 的操作实际上就是对 HashMap 的操作

二、源码分析

2.1 定义

public class HashSet<E> extends AbstractSet<E> 
		implements Set<E>, Cloneable, java.io.Serializable
  • HashSet <E>:存储的是单个泛型元素
  • extends AbstractSet<E>:继承自AbstractSet,实现Set接口时需要实现的工作量大大减少了
  • implements Set<E>:实现了Set接口,提供了所有可选的 Set 操作
  • implements Cloneable:可以调用 clone() 方法来返回实例的 field-for-field 拷贝
  • implements Serializable:可以序列化

2.2 字段

// HashSet的底层就是一个HashMap实例
private transient HashMap<E,Object> map;

// HashMap是保存键值对的,而HashSet实际上只想保存key
// 因此创建一个PRESENT表示所有的value
private static final Object PRESENT = new Object();

2.3 构造方法

2.3.1 常规构造方法
  1. public HashSet():实际上就是构造一个空的HashMap,然后赋值给 map 字段
  2. public HashSet(Collection<? extends E> c):构造一个包含指定集合中所有元素的新set
  3. public HashSet(int initialCapacity, float loadFactor):构造一个新的空set,其底层HashMap实例具有指定的初始容量和加载因子
  4. public HashSet(int initialCapacity):构造一个新的空set,其底层HashMap实例具有指定的初始容量和默认的加载因子 (0.75)
2.3.2 特殊构造方法
  • 这个构造方法是一个包私有 (package private) 的方法,可以看到它的修饰符不是 public
  • 该方法仅用于构造 LinkedHashSet,创建的是 LinkedHashMap 而非之前的 HashMap,用于维护 Set 内元素的顺序
  • 在 LinkedHashSet 进行初始化时,通过增加 dummy 参数来调用该方法
HashSet(int initialCapacity, float loadFactor, boolean dummy) 
{
	map = new LinkedHashMap<>(initialCapacity, loadFactor);
}
### HashSet 介绍 HashSet 是 Java 集合框架中的一个类,它实现了 Set 接口,基于哈希表(实际上是一个 HashMap 实例)来存储元素。HashSet 不允许存储重复的元素,并且不保证元素的顺序,因为它不维护元素的插入顺序或其他特定顺序。哈希技术是 Java 集合框架的基石,深入理解 HashSet 的实现原理,能提升代码性能,培养底层思维[^1]。 ### 使用方法 #### 1. 创建 HashSet ```java import java.util.HashSet; public class HashSetExample { public static void main(String[] args) { // 创建一个 HashSet 对象 HashSet<String> set = new HashSet<>(); // 使用 with_hasher 方法创建具有指定哈希函数的 HashSet(这里只是示例语法,实际 Java 里不是这种写法) // 假设存在自定义哈希函数 MyHasher // HashSet<String, MyHasher> setWithHasher = HashSet.with_hasher(new MyHasher()); } } ``` #### 2. 添加元素 ```java import java.util.HashSet; public class HashSetExample { public static void main(String[] args) { HashSet<String> set = new HashSet<>(); // 添加元素 boolean result1 = set.add("apple"); boolean result2 = set.add("banana"); boolean result3 = set.add("apple"); // 重复元素,添加失败 System.out.println(result1); // 输出: true System.out.println(result2); // 输出: true System.out.println(result3); // 输出: false } } ``` 这里的 `add` 方法有返回值,如果传入的元素是集合中不存在的新值,返回 `true` 表示添加成功;如果传入的是集合中已存在的重复值,返回 `false` 表示添加失败,其内部实现是适配到 `HashMap` 上完成的,`HashSet` 的 `add` 方法通过 `HashMap.put` 方法的返回结果来判断是否添加成功[^3][^5]。 #### 3. 判断元素是否存在 ```java import java.util.HashSet; public class HashSetExample { public static void main(String[] args) { HashSet<String> set = new HashSet<>(); set.add("apple"); boolean contains = set.contains("apple"); System.out.println(contains); // 输出: true } } ``` #### 4. 删除元素 ```java import java.util.HashSet; public class HashSetExample { public static void main(String[] args) { HashSet<String> set = new HashSet<>(); set.add("apple"); boolean removed = set.remove("apple"); System.out.println(removed); // 输出: true } } ``` #### 5. 遍历元素 ```java import java.util.HashSet; import java.util.Iterator; public class HashSetExample { public static void main(String[] args) { HashSet<String> set = new HashSet<>(); set.add("apple"); set.add("banana"); // 使用迭代器遍历 Iterator<String> iterator = set.iterator(); while (iterator.hasNext()) { System.out.println(iterator.next()); } // 使用增强 for 循环遍历 for (String element : set) { System.out.println(element); } } } ``` ### 相关技术细节 - **哈希函数**:`HashSet` 依赖于元素的 `hashCode` 方法来确定元素在哈希表中的存储位置。`Object` 类的 `hashCode` 方法返回的哈希码具有地址唯一性,但为了让程序的运行逻辑符合现实生活(即属性相同的对象被看作同一个对象),`Object` 的子类通常会重写 `hashCode` 方法,基本数据类型的实现类都已经重写了 `hashCode` 和 `equals` 方法,自定义的类需要开发者自己重写这两个方法[^4]。 - **内部实现**:`HashSet` 内部使用 `HashMap` 来存储元素,`HashSet` 的元素作为 `HashMap` 的键,而 `HashMap` 的值则是一个固定的对象。`HashSet` 的操作实际上是适配到 `HashMap` 上完成的,例如 `HashSet` 的 `add` 方法通过 `HashMap` 的 `put` 方法来实现[^3][^5]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值