HashSet 是如何保证元素不重复的?,2024年最新java项目开发实战入门百度云

复制代码

以上程序的执行结果如下:

image.png

从上述代码和执行结果可以看出,HashSet 插入的顺序是:深圳 -> 北京 -> 西安,而循环打印的顺序却是:西安 -> 深圳 -> 北京,所以 HashSet 是无序的,不能保证插入和迭代的顺序一致

PS:如果要保证插入顺序和迭代顺序一致,可使用 LinkedHashSet 来替换 HashSet。

3.HashSet 错误用法


有人说 HashSet 只能保证基础数据类型不重复,却不能保证自定义对象不重复?这样说对吗? 我们通过以下示例来说明此问题。

3.1 HashSet 与基本数据类型

使用 HashSet 存储基本数据类型,实现代码如下:

HashSet longSet = new HashSet<>();

longSet.add(666l);

longSet.add(777l);

longSet.add(999l);

longSet.add(666l);

// 循环打印 HashSet 中的所有元素

longSet.forEach(l -> System.out.println(l));

复制代码

以上程序的执行结果如下:

image.png

从上述结果可以看出,使用 HashSet 可以保证基础数据类型不重复。

3.2 HashSet 与自定义对象类型

接下来,将自定义对象存储到 HashSet 中,实现代码如下:

public class HashSetExample {

public static void main(String[] args) {

HashSet personSet = new HashSet<>();

personSet.add(new Person(“曹操”, “123”));

personSet.add(new Person(“孙权”, “123”));

personSet.add(new Person(“曹操”, “123”));

// 循环打印 HashSet 中的所有元素

personSet.forEach(p -> System.out.println§);

}

}

@Getter

@Setter

@ToString

class Person {

private String name;

private String password;

public Person(String name, String password) {

this.name = name;

this.password = password;

}

}

复制代码

以上程序的执行结果如下:

image.png

从上述结果可以看出,自定义对象类型确实没有被去重,那也就是说 HashSet 不能实现自定义对象类型的去重咯? 其实并不是,HashSet 去重功能是依赖元素的 hashCode 和 equals 方法判断的,通过这两个方法返回的都是 true 那就是相同对象,否则就是不同对象。而前面的 Long 类型元素之所以能实现去重,正是因为 Long 类型中已经重写了 hashCode 和 equals 方法,具体实现源码如下:

@Override

public int hashCode() {

return Long.hashCode(value);

}

public boolean equals(Object obj) {

if (obj instanceof Long) {

return value == ((Long)obj).longValue();

}

return false;

}

//省略其他源码…

复制代码

更多关于 hashCode 和 equals 的内容,详见:mp.weixin.qq.com/s/40zaEJEkQ… ​

那么,想让 HashSet 支持自定义对象去重,只需要在自定义对象中重写 hashCode 和 equals 方法即可,具体实现代码如下:

@Setter

@Getter

@ToString

class Person {

private String name;

private String password;

public Person(String name, String password) {

this.name = name;

this.password = password;

}

@Override

public boolean equals(Object o) {

if (this == o) return true; // 引用相等返回 true

// 如果等于 null,或者对象类型不同返回 false

if (o == null || getClass() != o.getClass()) return false;

// 强转为自定义 Person 类型

Person persion = (Person) o;

// 如果 name 和 password 都相等,就返回 true

return Objects.equals(name, persion.name) &&

Objects.equals(password, persion.password);

}

@Override

public int hashCode() {

// 对比 name 和 password 是否相等

return Objects.hash(name, password);

}

}

复制代码

重新运行以上代码,执行结果如下图所示:

image.png

从上述结果可以看出,之前的重复项“曹操”已经被去重了。

4.HashSet 如何保证元素不重复?


我们只要了解了 HashSet 执行添加元素的流程,就能知道为什么 HashSet 能保证元素不重复了? HashSet 添加元素的执行流程是:当把对象加入 HashSet 时,HashSet 会先计算对象的 hashcode 值来判断对象加入的位置,同时也会与其他加入的对象的 hashcode 值作比较,如果没有相符的 hashcode,HashSet 会假设对象没有重复出现,会将对象插入到相应的位置中。但是如果发现有相同 hashcode 值的对象,这时会调用对象的 equals() 方法来检查对象是否真的相同,如果相同,则 HashSet 就不会让重复的对象加入到 HashSet 中,这样就保证了元素的不重复。 ​

为了更清楚的了解 HashSet 的添加流程,我们可以尝试阅读 HashSet 的具体实现源码,HashSet 添加方法的实现源码如下(以下源码基于 JDK 8):

// hashmap 中 put() 返回 null 时,表示操作成功

public boolean add(E e) {

return map.put(e, PRESENT)==null;

}

复制代码

从上述源码可以看出 HashSet 中的 add 方法,实际调用的是 HashMap 中的 put,那么我们继续看 HashMap 中的 put 实现:

// 返回值:如果插入位置没有元素则返回 null,否则返回上一个元素

public V put(K key, V value) {

return putVal(hash(key), key, value, false, true);

}

复制代码

从上述源码可以看出,HashMap 中的 put() 方法又调用了 putVal() 方法,putVal() 的源码如下:

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,

boolean evict) {

Node<K, V>[] tab;

Node<K, V> p;

int n, i;

//如果哈希表为空,调用 resize() 创建一个哈希表,并用变量 n 记录哈希表长度

if ((tab = table) == null || (n = tab.length) == 0)

n = (tab = resize()).length;

/**

  • 如果指定参数 hash 在表中没有对应的桶,即为没有碰撞

  • Hash函数,(n - 1) & hash 计算 key 将被放置的槽位

  • (n - 1) & hash 本质上是 hash % n 位运算更快

*/

if ((p = tab[i = (n - 1) & hash]) == null)

// 直接将键值对插入到 map 中即可

tab[i] = newNode(hash, key, value, null);

else {// 桶中已经存在元素

Node<K, V> e;

K k;

// 比较桶中第一个元素(数组中的结点)的 hash 值相等,key 相等

if (p.hash == hash &&

((k = p.key) == key || (key != null && key.equals(k))))

// 将第一个元素赋值给 e,用 e 来记录

e = p;

// 当前桶中无该键值对,且桶是红黑树结构,按照红黑树结构插入

else if (p instanceof TreeNode)

e = ((TreeNode<K, V>) p).putTreeVal(this, tab, hash, key, value);

// 当前桶中无该键值对,且桶是链表结构,按照链表结构插入到尾部

else {

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值