Java集合——HashSet

本文深入解析了HashSet的工作原理,包括其内部结构、实现机制及常用方法。介绍了HashSet如何通过HashMap存储元素,确保元素的唯一性,并提供了多种构造器选项。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

public class HashSet<E> extends AbstractSet<E> implements Set<E>, Cloneable, java.io.Serializable


HashSet实现Set接口,内部维护一个HashMap实例变量。不保证顺序,允许null元素。


对于基本的操作,如add,remove,contains,size,只需要常量的时间复杂度。


不是线程安全的,如果在多线程环境下,需要被同步化,如调用方法Collections.synchronizedSet(new HashSet())。


HashSet的迭代器是快速失败的,如果一个HashSet在迭代器被创建后被改变(不是使用迭代器的remove方法),迭代器会抛出ConcurrentModificationException。


private transient HashMap<E,Object> map;

// Dummy value to associate with an Object in the backing Map
private static final Object PRESENT = new Object();


两个实例变量,map是内部维护的HashMap,PRESENT是放到HashMap的value的变量。

 

5个构造器:


//空set, map对象的初始容量16,负载因子0.75
public HashSet() {
    map = new HashMap<>();
}

public HashSet(Collection<? extends E> c) {
    map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
    addAll(c);
}

public HashSet(int initialCapacity, float loadFactor) {
    map = new HashMap<>(initialCapacity, loadFactor);
}

//初始化容量,使用默认负载因子0.75
public HashSet(int initialCapacity) {
    map = new HashMap<>(initialCapacity);
}

//使用LinkedHashMap,dummy参数的作用只是与使用HashMap实现的构造器有不一样的

//方法签名
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
    map = new LinkedHashMap<>(initialCapacity, loadFactor);
}


//使用的是HashMap的键集合,返回的迭代器是键集合的迭代器
public Iterator<E> iterator() {
    return map.keySet().iterator();
}

//放进map的键值对是,参数e和常量PRESENT,所有键值对的值都是同一个Object对象
public boolean add(E e) {
    return map.put(e, PRESENT)==null;
}


如果元素e已经存在HashSet之中,不改变Set并返回false,如果e不在HashSet之中,返回true


public boolean remove(Object o) {
    return map.remove(o)==PRESENT;
}


如果o在HashSet中,返回值是true,否则为false

 

还有一些其他方法没列出来,如size,isEmpty。


HashSet有实现Clonable接口,所以有clone方法,实现Serializable接口,所以有writeObject,readObject序列化反序列化方法。

### Java `HashSet` 使用方法及特点 #### 一、`HashSet` 基本概念 `HashSet` 实现了 `Set` 接口,它基于哈希表实现。此集合不允许存储重复元素,并且不保证元素的迭代顺序[^1]。 #### 二、创建并操作 `HashSet` ```java // 创建 HashSet 对象 import java.util.HashSet; public class Main { public static void main(String[] args) { // 初始化 HashSet HashSet<String> set = new HashSet<>(); // 添加元素到 HashSet 中 set.add("Apple"); set.add("Banana"); set.add("Orange"); // 尝试添加已存在的元素 boolean isAdded = set.add("Apple"); // 返回 false 表明未成功加入 System.out.println(isAdded); // 输出: false System.out.println(set.size()); // 输出: 3 (因为 "Apple" 已经存在) // 移除指定元素 set.remove("Banana"); // 判断是否存在某个元素 boolean containsElement = set.contains("Orange"); System.out.println(containsElement); // true 如果该元素存在于集合中 // 遍历 HashSet 内部的所有元素 for (String fruit : set) { System.out.println(fruit); } } } ``` #### 三、`HashSet` 特性 - **无序性**:`HashSet` 不维护任何特定顺序来保存其内部项;因此,在遍历时无法预测返回项目的顺序。 - **不可重复性**:由于实现了 `Set` 接口,所以同一个对象只能被存入一次。当尝试向其中插入相同的内容时会失败(即不会改变原有状态),这依赖于对象自身的 `hashCode()` 和 `equals(Object obj)` 方法来进行比较[^2]。 - **线程不安全**:默认情况下不是同步化的容器类,如果多个线程并发访问,则需外部提供额外保护机制以确保安全性。 为了使自定义类型的实例能够在 `HashSet` 中正常工作——特别是要达到预期中的唯一性和查找效率——通常建议开发者覆写这两个函数(`hashCode()`, `equals(Object obj)`),从而让 JVM 能够依据这些逻辑判定两个不同引用所指向的对象是否相等以及计算散列码用于定位桶位置[^3]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值