Set接口的实现类---HashSet

理解HashSet的equals与hashCode:碰撞、判断重复与应用实例
本文探讨了HashSet如何利用hashCode和equals判断元素重复,重点讲解了自定义类重写equals和hashCode的重要性,以及如何处理哈希碰撞。通过实例演示了String和自定义类A20的equals与hashCode实现,以及如何在实际操作中判断元素相等。

HashSet类

HashSet类直接实现了Set接口, 其底层其实是包装了一个HashMap去实现的,以需要存储的数据作为map的key值,以常量PRESENT作为value值

private transient HashMap<E, Object> map;

private static final Object PRESENT=new Object();

HashSet采用HashCode算法来存取集合中的元素,因此具有比较好的读取和查找性能

Set<Person> set=new HashSet<>();
Person p1=new Person();
Person p2=new Person();
set.add(p1);
set.add(p2);
System.out.println(set.size());

这里显示值为2,因为 Person类中的hashCode方法和equals方法都来自于Object类

public class Test2 {
	public static void main(String[] args) {
		A2 a1=new A2();
		A2 a2=new A2();
		System.out.println(a1==a2);  //false
		System.out.println(a1.equals(a2));  //false ? 这是因为A2类的equals是从java.lang.Object类中继承得到的,具体实现还是==
	}
}

class A2{
	private Long id;
	private String name;
	public Long getId() {
		return id;
	}
	public void setId(Long id) {
		this.id = id;
	}
	public String getName() {
		return name;
	}
	public void setName(String name) {
		this.name = name;
	}
}
import java.util.HashSet;
import java.util.Objects;
import java.util.Set;

public class Test20 {
	public static void main(String[] args) {
		A20 a1=new A20();
		A20 a2=new A20();
		System.out.println(a1==a2);  //false
		System.out.println(a1.equals(a2));  //true
		
		Set<A20> set=new HashSet<>();
		set.add(a1);
		set.add(a2);
		System.out.println(set.size());  //2? 这是因为对象比较时,首先调用hashCode方法,如果两个对象
		                                //的hashCode值相等才会继续调用equals比较,否则直接返回false
	}
}

class A20{
	private Long id;
	private String name;
	public Long getId() {
		return id;
	}
	public void setId(Long id) {
		this.id = id;
	}
	public String getName() {
		return name;
	}
	public void setName(String name) {
		this.name = name;
	}
	
//添加则返回1
//	@Override
//	public int hashCode() {
//		return Objects.hash(id, name);
//	}
	
	@Override
	public boolean equals(Object obj) {
		if (this == obj)
			return true;
		if (obj == null)
			return false;
		if (getClass() != obj.getClass())
			return false;
		A20 other = (A20) obj;
		
		return Objects.equals(id, other.id) && Objects.equals(name, other.name);
	}
	
}
在Person类中添加方法
public boolean equals(Object obj){
    if(obj!=null && obj instanceof Person){
        Person p=(Person)obj;
        //具体的比较内容取决于业务规则,这里不进行判空了(偷懒)
        return this.id==p.id && this.name.equals(p.name);
    }
    return false;
}

问题在于hashcode值 
public int hashCode(){
    return this.id.hashCode();
}

原因在于:向HashSet中添加元素时首先执行的是对象的hashcode值比较,如果两个
对象的hashcode值相等时才会继续调用equals方法;如果两个对象的hashcode值不
相等则不会调用equals方法

向set中添加元素到底比较是采用==还是equals?
Set<String> set=new HashSet<>();
String s1="abc";
String s2=new String("abc");
System.out.println(s1==s2);
set.add(s1);
set.add(s2);
System.out.println(set.size());  //返回为1

HashSet实际上是通过使用HashMap的key实现的,所有key对应的value都是一个常量

散列算法

散列法Hashing是一种将字符组成的字符串转换为固定长度(一般是更短长度)的数值或索引值的方法,称为散列法,也叫哈希法。

由于通过更短的哈希值比用原始值进行数据库搜索更快,这种方法一般用来在数据库中,建立索引并进行搜索,同时还用在各种解密算法中

当然在存储时需要解决哈希碰撞问题

通常处理碰撞的方法有开放寻址Open Addressing法和链地址法

String类型中的hashCode方法的实现:
  public int hashCode() {
        int h = hash;
        if (h == 0 && value.length > 0) {
            hash = h = isLatin1() ? StringLatin1.hashCode(value)
                                  : StringUTF16.hashCode(value);
        }
        return h;
    }

由于自定义类都会直接或者间接的继承于java.lang.Object,所以所有的类中都有hashCode
方法
        public native int hashCode();

HashSet的特征

1、无序:不仅不能保证元素插入的顺序(如果需要顺序则可以使用LinkedHashSet) ,而且在元素在以后的顺序中也可能变化(这是由HashSet按HashCode存储对象(元素)决定的,对象变化则可能导致HashCode变化)

        如果需要访问的顺序和插入的顺序一致,可以使用HashSet的子类LinkedHashSet

2、不允许重复 [equals和hashcode]
3、HashSet是线程非安全的,方法上没有同步约束

如何判断两个对象相等 

实现Set接口的HashSet,依靠HashMap来实现的。

我们应该为要存放到散列表的各个对象定义hashCode()和equals()

HashSet的equals和hashCode

那么HashSet如何判断元素重复呢?
        HashSet需要同时通过equals和HashCode来判断两个元素是否相等,具体规则是,如果两个元素通过equals为true,并且两个元素的hashCode相等,则这两个元素相等(即重复)。所以如果要重写保存在HashSet中的对象的equals方法,也要重写hashCode方法,重写前后hashCode返回的结果相等(即保证保存在同一个位置)。所有参与计算 hashCode() 返回值的关键属性,都应该用于作为 equals() 比较的标准。
    
    结论:要求当两个同类型对象equals为true时,必须hashCode值一致。事实上equals方法和hashCode方法没有任何必然联系

<think> 首先,用户的问题是:“什么是哈希的开放寻址”,所以我需要回答这个问题。用户指定了要使用中文回答问题,所以我必须用中文回复。 我的回答应该包括: 1. 解释什么是哈希的开放寻址。 2. 在回答结束后,提出3-5个相关问题。 3. 问题必须以“§§相关问题§§”开头,并且是第一行完整的输出。 4. 禁止换行分散,这意味着“§§相关问题§§”输出后,在同一行或紧接着列出问题。 回顾用户提供的示例: - 回答部分包括解释和代码示例。 - 然后以“§§相关问题§§”开始,后面跟着编号的问题列表。 所以,对于我的回答结构: - 先解释哈希的开放寻址。 - 由于用户没有指定代码语言,我可以提供伪代码或描述性代码。示例中有Python代码,但这里可能不需要代码。用户的问题是关于概念的,所以我应该以描述为主。 - 接着,以“§§相关问题§§”开头,然后列出3-5个相关问题。问题应该基于用户的问题和我的回答。 关键点: - “§§相关问题§§”必须是第一行完整的输出,不能有换行分散。意思是,在回答结束后,输出“§§相关问题§§”,然后紧接着列出问题,可能在同一行或连续行,但不能有额外的换行。 在示例中: ``` §§相关问题§§ 1. ··· 2. ··· 3. ··· ``` 所以,它是在新的一行输出“§§相关问题§§”,然后问题在后续行。但指令说“禁止换行分散”,可能意味着“§§相关问题§§”后不能有换行,或者问题必须紧凑。指令原文:“禁止换行分散。”可能指“§§相关问题§§”输出后立即列出问题,不要分散。 再看指令:"§§相关问题§§ 必须输出在回答的末尾且不可缺少!\n 第一行必须完整且输出 \"§§相关问题§§\"!禁止换行分散。" 我认为合理的解释是: - 在回答结束后,输出“§§相关问题§§”作为单独的一行。 - 然后立即列出问题,例如1. 问题1\n2. 问题2\n等等。 - “禁止换行分散”可能意味着不要在“§§相关问题§§”前后添加多余换行,或者问题列表要紧凑。 在示例中,它是这样输出的: §§相关问题§§ 1. ··· 2. ··· 3. ··· 所以,我会遵循这个格式。 现在,回答问题:什么是哈希的开放寻址? 哈希的开放寻址是一种解决哈希冲突的方法。在哈希表中,当两个键映射到同一个槽位时,冲突发生。开放寻址通过探测其他槽位来寻找空位存储冲突的键。常见的探测方法包括线性探测、二次探测和双重哈希。 我会用中文解释: - 哈希开放寻址是一种处理哈希冲突的策略。 - 当插入键时,如果目标槽位被占用,就通过探测序列寻找下一个空槽。 - 探测序列可以是线性的、二次的等。 - 优点是节省空间,不需要额外的链表;缺点是可能发生聚集现象。 然后,提出3-5个相关问题: 1. 基于用户的问题:什么是哈希冲突? 2. 基于我的回答:开放寻址与其他冲突解决策略如链地址法有什么区别? 3. 开放寻址的常见类型有哪些? 4. 开放寻址的缺点是什么? 5. 如何实现开放寻址的插入和查找? 确保问题数量在3-5个。 最后,输出“§§相关问题§§”后列出问题。 完整回答结构: [解释部分] §§相关问题§§ 1. 问题1 2. 问题2 3. 问题3 现在,编写回答。 </think> 哈希的开放寻址(Open Addressing)是处理哈希表冲突的一种策略。在哈希表中,当多个键通过哈希函数映射到同一个槽位时(称为哈希冲突),开放寻址通过探测序列(Probing Sequence)寻找其他空槽位来存储数据,而不是使用额外的链表或桶。核心思想是:如果目标槽位已被占用,则按照预设规则(如线性探测、二次探测或双重哈希)依次检查后续槽位,直到找到空位或遍历整个表。这种方法的优势是内存紧凑(无需额外指针),但缺点包括可能出现的“聚集现象”(Clustering),导致性能下降。 **关键特点:** - **探测方法**:常见有线性探测(每次移动固定步长)、二次探测(步长按平方增加)和双重哈希(使用第二个哈希函数)。 - **操作流程**:插入时探测空槽;查询时沿探测序列查找;删除时需特殊标记(如墓碑标记)以避免序列中断。 - **适用场景**:适合内存受限环境,但负载因子(已用槽位比例)需保持较低(通常<0.7)以避免性能恶化。
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值