HashSet

本文详细介绍了HashSet的内部实现原理,包括其基于HashMap的底层结构、构造函数、主要API等,并提供了遍历HashSet的三种方法。

基于JDK7

一、概述

HashSet 是一个没有重复元素的集合。底层是由HashMap实现的,不保证元素的顺序。HashSet允许使用 null 元素。

public class HashSet<E>
    extends AbstractSet<E>
    implements Set<E>, Cloneable, java.io.Serializable

HashSet继承了AbstractSet类,实现了Set、Cloneable、Serializable接口。
AbstractSet提供 Set 接口的骨干实现,从而最大限度地减少了实现此接口所需的工作。Set接口是一种不包括重复元素的Collection。
基本属性

//底层就是由hashmap实现,hashmap的 key 座位set的值,value为一个常量object
 private transient HashMap<E,Object> map;
 private static final Object PRESENT = new Object();

构造函数

//初始化一个空的HashMap,默认初始容量为16和加载因子0.75。
public HashSet() {
    map = new HashMap<>();
}
//构造一个包含指定 collection 中的元素的新set,初始容量为max(16, collection.size()/0.75+1)
public HashSet(Collection<? extends E> c) {
    map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
    addAll(c);
}
public HashSet(int initialCapacity, float loadFactor) {
    map = new HashMap<>(initialCapacity, loadFactor);
}
public HashSet(int initialCapacity) {
    map = new HashMap<>(initialCapacity);
}
//访问权限为包权限,不对外公开的
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
    map = new LinkedHashMap<>(initialCapacity, loadFactor);
}

二、API

HashSet是非同步的。如果多个线程同时访问一个HashSet,而其中至少一个线程修改了该 set,那么它必须 保持外部同步。这通常是通过对自然封装该 set 的对象执行同步操作来完成的。如果不存在这样的对象,则应该使用 Collections.synchronizedSet 方法来“包装” set。最好在创建时完成这一操作,以防止对该 set 进行意外的不同步访问:

Set s = Collections.synchronizedSet(new HashSet(...));

由于HashSet而言,其方法的实现过程是非常简单的。

主要API

boolean         add(E object)
void            clear()
Object          clone()
boolean         contains(Object object)
boolean         isEmpty()
Iterator<E>     iterator()
boolean         remove(Object object)
int             size()

三、遍历方式

3.1 iterator遍历

(1)根据iterator()获取HashSet的迭代器。
(2)遍历迭代器获取各个元素。

for(Iterator iterator = set.iterator();iterator.hasNext();) { 
    iterator.next();
}   

3.2 for-each遍历

(1)根据API的 toArray() 接口获取 HashSet的元素集合对应的数组。
(2)遍历数组,获取各个元素。

// T 为元素类型 即泛型
T[] arr = (T[])set.toArray(new T[0]);
for (T str:arr)

3.3 demo

学习/参考

http://cmsblogs.com/?p=599
https://www.cnblogs.com/skywang12345/p/3311252.html

### HashSet 介绍 HashSetJava 集合框架中的一个类,它实现了 Set 接口,基于哈希表(实际上是一个 HashMap 实例)来存储元素。HashSet 不允许存储重复的元素,并且不保证元素的顺序,因为它不维护元素的插入顺序或其他特定顺序。哈希技术是 Java 集合框架的基石,深入理解 HashSet 的实现原理,能提升代码性能,培养底层思维[^1]。 ### 使用方法 #### 1. 创建 HashSet ```java import java.util.HashSet; public class HashSetExample { public static void main(String[] args) { // 创建一个 HashSet 对象 HashSet<String> set = new HashSet<>(); // 使用 with_hasher 方法创建具有指定哈希函数的 HashSet(这里只是示例语法,实际 Java 里不是这种写法) // 假设存在自定义哈希函数 MyHasher // HashSet<String, MyHasher> setWithHasher = HashSet.with_hasher(new MyHasher()); } } ``` #### 2. 添加元素 ```java import java.util.HashSet; public class HashSetExample { public static void main(String[] args) { HashSet<String> set = new HashSet<>(); // 添加元素 boolean result1 = set.add("apple"); boolean result2 = set.add("banana"); boolean result3 = set.add("apple"); // 重复元素,添加失败 System.out.println(result1); // 输出: true System.out.println(result2); // 输出: true System.out.println(result3); // 输出: false } } ``` 这里的 `add` 方法有返回值,如果传入的元素是集合中不存在的新值,返回 `true` 表示添加成功;如果传入的是集合中已存在的重复值,返回 `false` 表示添加失败,其内部实现是适配到 `HashMap` 上完成的,`HashSet` 的 `add` 方法通过 `HashMap.put` 方法的返回结果来判断是否添加成功[^3][^5]。 #### 3. 判断元素是否存在 ```java import java.util.HashSet; public class HashSetExample { public static void main(String[] args) { HashSet<String> set = new HashSet<>(); set.add("apple"); boolean contains = set.contains("apple"); System.out.println(contains); // 输出: true } } ``` #### 4. 删除元素 ```java import java.util.HashSet; public class HashSetExample { public static void main(String[] args) { HashSet<String> set = new HashSet<>(); set.add("apple"); boolean removed = set.remove("apple"); System.out.println(removed); // 输出: true } } ``` #### 5. 遍历元素 ```java import java.util.HashSet; import java.util.Iterator; public class HashSetExample { public static void main(String[] args) { HashSet<String> set = new HashSet<>(); set.add("apple"); set.add("banana"); // 使用迭代器遍历 Iterator<String> iterator = set.iterator(); while (iterator.hasNext()) { System.out.println(iterator.next()); } // 使用增强 for 循环遍历 for (String element : set) { System.out.println(element); } } } ``` ### 相关技术细节 - **哈希函数**:`HashSet` 依赖于元素的 `hashCode` 方法来确定元素在哈希表中的存储位置。`Object` 类的 `hashCode` 方法返回的哈希码具有地址唯一性,但为了让程序的运行逻辑符合现实生活(即属性相同的对象被看作同一个对象),`Object` 的子类通常会重写 `hashCode` 方法,基本数据类型的实现类都已经重写了 `hashCode` 和 `equals` 方法,自定义的类需要开发者自己重写这两个方法[^4]。 - **内部实现**:`HashSet` 内部使用 `HashMap` 来存储元素,`HashSet` 的元素作为 `HashMap` 的键,而 `HashMap` 的值则是一个固定的对象。`HashSet` 的操作实际上是适配到 `HashMap` 上完成的,例如 `HashSet` 的 `add` 方法通过 `HashMap` 的 `put` 方法来实现[^3][^5]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值