为什么重新定义equals方法,就必须要重新定义hashCode方法?

探讨Java中对象相等性的判断方法,hashCode与equals方法的关系及其在集合类中的应用,如何通过hashCode提升查找效率。

版权声明:本文为优快云博主「Sauron1」的原创文章,遵循CC 4.0 by-sa版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.youkuaiyun.com/pzxwhc/article/details/38047909

 

一.概述(怎么判断对象相等,hashCode作用)

       在Java中,判断两个对象是否相等,先判断两个对象的hashcode是否相等,如果hashcode不等,那么认为这两个对象也不相等;如果相等,那么判断两个对象用equals是否相等,如果相等,认为两个对象也相等,否则认为两个对象不等。

      Object中的hashcode方法在我们创建对象的时候为每个对象计算一个散列码。自己定义的类也可以重写 hashcode,按照自己的方法计算散列码。(重写时简单的返回一个int值也可以,但是一般需要根据你的业务逻辑重写hashcode方法)

       数据结构有一种为了提高查找的效率而存在的数据结构——散列表,散列表其实是普通数组概念的推广,因为可以对数组进行直接寻址,故可以再O(1)时 间内访问数组的任意元素。hashcode方法的作用,它就是用来提高效率的,有句话说得好:为速度而散列。因为散列的Set和Map是基于 hashcode方法来查找对象的,所以你在使用这些类的时候一定要覆盖hashcode方法,而非散列的Set和Map,例如 TreeSet,TreeMap等,它们只需equals方法就可以唯一确定对象的身份。

二.不使用hashCode会产生的问题

       Java中的集合(Collection)有两类,一类是List,再有一类是Set。前者集合内的元素是有序的,元素可以重复;后者元素无序,但元素不 可重复。 那么这里就有一个比较严重的问题了:要想保证元素不重复,可两个元素是否重复应该依据什么来判断呢? 这就是Object.equals方法 了。但是,如果每增加一个元素就检查一次,那么当元素很多时,后添加到集合中的元素比较的次数就非常多了。 也就是说,如果集合中现在已经有1000个元 素,那么第1001个元素加入集合时,它就要调用1000次equals方法。这显然会大大降低效率。

三.利用hashCode解决上述问题

       Java采用了哈希表的原理。哈希(Hash)实际上是个人名,由于他提出一哈希算法的概念,所以就以他的名字命名了。 哈希算法也称为散列算法,是将数据依特定算法直接指定到一个地址上。

       初学者可以这样理解,hashCode方法实际上返回的就是对象存储的物理地址(实际可能并不是)。这样一来,当集合要添加新的元素时,先调用这个元素的 hashCode方法,就一下子能定位到它应该放置的物理位置上。如果这个位置上没有元素,它就可以直接存储在这个位置上,不用再进行任何比较了;如果这 个位置上已经有元素了,就调用它的equals方法与新元素进行比较(这里注意,为什么相同了还要比较呢,是因为不同的对象可能有相同的地址)相同的话就 不存了,不相同就散列其它的地址。所以这里存在一个冲突解决的问题。这样一来实际调用equals方法的次数就大大降低了,几乎只需要一两次。

四.需要注意的地方:

Java对于eqauls方法和hashCode方法是这样规定的: 
1。如果两个对象相同,那么它们的hashCode值一定要相同;

2。如果两个对象的 hashCode相同,它们并不一定相同    上面说的对象相同指的是用eqauls方法比较。  


五. Equals和hashcode的关系

 1. 对于良好的编程风格而言,你应该在重写equals()方法的同时,也重写hashCode()方法。

        如果你的对象想放进散列存储的集合中(比如:HashSet,LinkedHashSet)或者想作为散列Map(例如:HashMap,LinkedHashMap等等)的Key时,在重写equals()方法的同时,必须重写hashCode()方法。 

2. Jdk为什么希望我们在重写equals方法时,非常有必要重写hashcode方法。Hashcode是用于散列数据的快速存取,如利用 HashSet/HashMap/HashTable类来存储数据时,都是根据存储对象的hashcode值来判断是否相同。如果我们对一个对象重写了 equals方法,意思是只要对象的成员变量的值相等那么equals就返回true,但不重写hashcode方法,那么我们再new一个新的对象的时 候,当原对象.equals(新对象)等于true的时候,两者的hashcode值是不相等的。由此产生了理解上的不一致,比如在存储散列集合(如 Set类)的时候,将会存储了两个一样的对象,导致混淆,因此,也就必须重写hashcode方法。为了保证这种一致性,必须满足两个条件:

      1. 当obj1.equals(obj2)的时候。Obj1.hashCode()== obj2.hashCode() 必须为true。

      2. 当 obj1.hashcode() ==obj2.hashcode()为false的时候,obj1.equals(obj2)也必须为false。

<think>首先,用户的问题是关于Java中重写equals方法时为何必须同时重写hashCode方法。我需要基于提供的引用内容来构建回答。 引用内容总结: - 引用[1]:重写equals时必须重写hashCode,以确保对象在哈希集合(如HashMap、HashSet)中正确使用。 - 引用[2]:如果不重写hashCode,可能会导致equals相同的对象但hashCode不同,这在哈希集合中会引起问题。 - 引用[3]:两个对象equals返回true时,hashCode也必须相同;这是Java规范的要求。 - 引用[4]:重写equals时必须重写hashCode,以确保相等的对象有相同的哈希值,以便在哈希集合中正常工作。 系统指令: - 所有行内数学表达式使用$...$格式,但这个问题是关于Java编程的,可能没有数学内容,所以我可以忽略数学部分。 - 独立公式使用$$...$$格式并单独成段,同样,可能不需要。 - LaTeX语法正确:确保任何公式正确。 - 使用中文回答:整个回答必须是中文。 - 生成相关问题:在回答结束后,生成相关问题。 - 回答中引用的段落末尾自然地添加引用标识:如[^1],[^2]等。 - 回答结构清晰,帮助用户逐步解决问题,保证真实可靠。 用户可见层指令: - 回答结构清晰,逐步解决问题。 - 尽量保证回答真实可靠。 我的回答结构: 1. **引言**:解释问题的重要性。 2. **原因解释**:逐步说明为什么必须同时重写hashCode。 3. **关键点**:基于引用,解释equalshashCode的关系。 4. **后果**:如果不重写hashCode会发生什么。 5. **如何正确实现**:简要说明如何重写hashCode。 6. **总结**。 7. **相关问题**:生成相关问题。 生成相关问题: - 基于主题,生成2-3个相关问题。 最终回答格式: - 使用中文。 - 引用标识:当引用特定内容时添加[^n]。 - 代码块:如果需要展示代码,使用代码块格式。 由于这个问题是概念性的,不需要代码,但可以引用示例。 内容大纲: 1. **介绍equalshashCode方法**: - equals方法用于比较对象内容是否相等。 - hashCode方法返回对象的哈希码。 - 在Java中,两者有契约关系。 2. **为什么必须同时重写**: - Java规范要求:如果两个对象equals返回true,则它们的hashCode必须相同[^3]。 - 确保在哈希集合中正常工作:如HashMap、HashSet等依赖于hashCode来存储和查找对象[^1][^4]。 - 如果不重写hashCode,可能导致equals相同的对象但hashCode不同,这违反了契约,并可能导致对象在集合中丢失或重复[^2]。 3. **后果示例**: - 例如,在HashSet中,添加两个equals相同但hashCode不同的对象时,它们可能被存储在不同的桶中,导致集合中有重复元素[^4]。 4. **如何正确重写**: - 重写hashCode时,确保equals相同的对象有相同的hashCode。 - 常用方法:使用对象的字段来计算hashCode,例如使用Objects.hash()方法。 5. **总结**:重写equals时必须重写hashCode以维护Java的契约和确保集合类的正确行为。 相关问题: 1. 如何正确重写equalshashCode方法? 2. 在Java中,hashCode方法的具体实现有哪些最佳实践? 3. 如果不重写hashCode方法,会对程序性能产生什么影响? 确保回答真实可靠:基于提供的引用,这些引用来自可靠来源(如Java文档或常见面试题)。</think>### Java中重写equals方法必须同时重写hashCode方法的原因 在Java中,重写`equals`方法时**必须**同时重写`hashCode`方法,这是Java语言规范的核心要求。这一规则确保了对象在哈希集合(如`HashMap`、`HashSet`或`Hashtable`)中能正确工作,并维护了对象相等性的一致性。下面我将逐步解释原因,帮助您彻底理解这一问题。 #### 1. **equalshashCode方法的契约关系** - Java规定了一个严格的契约:如果两个对象通过`equals`方法比较返回`true`,则它们调用`hashCode`方法返回的哈希码**必须相同**[^3]。反之则不一定成立(哈希码相同的对象不一定equals相同)。 - 这一契约是Java集合框架的基础。例如,`HashMap`在存储键值对时,先根据键的`hashCode`确定存储位置(桶),再使用`equals`精确比较键是否相等。如果契约被破坏,集合的行为将不可预测[^1][^4]。 #### 2. **如果不重写hashCode的后果** - **哈希集合失效**:假设只重写了`equals`而未重写`hashCode`,可能导致两个`equals`相同的对象拥有不同的哈希码。在`HashSet`中添加这样的对象时,它们可能被分配到不同的桶中,导致集合中出现“重复”元素(违反集合的唯一性)[^2][^4]。 - 示例:定义一个`Person`类,只重写`equals`(基于姓名和年龄),但不重写`hashCode`。如果将两个`equals`相同的`Person`对象添加到`HashSet`,它们可能都被存储(因为哈希码不同),而理论上应被视为同一对象。 - **性能问题**:在`HashMap`中查找键时,先通过`hashCode`快速定位桶,再用`equals`确认。如果哈希码不一致,查找可能退化到线性搜索(时间复杂度从$O(1)$变为$O(n)$),严重影响性能[^1]。 #### 3. **为什么哈希集合依赖这一契约** - 哈希集合的设计优化了存储和检索效率。`hashCode`提供了对象的“快速摘要”,而`equals`确保精确相等。如果只依赖`equals`,集合需要遍历所有元素比较,效率极低;而`hashCode`将对象分组到桶中,大幅减少比较次数[^1][^4]。因此,维护契约是保证集合类正确性和高效性的前提[^3]。 #### 4. **如何正确重写hashCode** - 重写`hashCode`时,需确保:如果`a.equals(b) == true`,则`a.hashCode() == b.hashCode()`。常用方法是基于对象的相同字段(用于`equals`比较的字段)计算哈希码。 - 示例实现(使用Java的`Objects.hash`工具类): ```java public class Person { private String name; private int age; @Override public boolean equals(Object obj) { if (this == obj) return true; if (obj == null || getClass() != obj.getClass()) return false; Person person = (Person) obj; return age == person.age && Objects.equals(name, person.name); } @Override public int hashCode() { return Objects.hash(name, age); // 基于name和age字段计算哈希码 } } ``` - 这里,`Objects.hash`自动生成一致的哈希码,确保契约被遵守[^2][^4]。 #### 总结 重写`equals`时必须重写`hashCode`,主要是为了维护Java的对象相等性契约,确保哈希集合类(如`HashMap`)能正确、高效地工作。如果忽略这一规则,程序可能出现逻辑错误(如集合中重复元素)或性能下降。在面向对象设计中,这被视为最佳实践,也是Java面试中的高频考点[^1][^3][^4]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值