前言
这是一道常见的面试题,同时也是一个非常重要的 Java 基础知识点。
在具体阐述标题内容之前,我们先来想一下,在什么场景下,我们需要重写这两个方法?
在绝大多数的情况下,重写这两个方法的是因为我们需要使用 HashSet 存储的元素类型是我们自己定义的对象类型,或者使用 HashMap 的时候,Key 的类型是我们自己定义的对象类型。
public class Person{
private void fun(){
HashSet<Person> set = new HashSet<>();
}
}
我们都知道,HashSet 内的元素与 HashMap 的 Key 是不重复的,这两种数据结构保证元素不重复的前提就是需要知道如何去判断对象是相等的。
这里直接上个结论,后续会进一步的阐述:要让 HashSet/HashMap 能把对象视为重复的或者说是相等的,需要这两个对象满足下述两个条件
- 对象 A 调用 hashCode() 方法的返回值与对象 B 调用 hashCode() 方法的返回值相等。
- A.equals(B) 必须返回 true.
默认的 hashCode() 与 equals() 方法实现
在研究 HashSet/HashMap 具体如何判定两个对象是否相等之前,我们先来看看 hashCode() 和 equals() 这两个方法的默认实现。
hashCode() 和 equals() 这两个方法都是类 Object 的方法,也就是说所有对象都拥有这两个方法。我们来分别看一下这两个方法的源码。
一、hashCode()
public native int hashCode();
hashCode() 是一个本地方法,由 C 语言实现,感兴趣的读者可以去 OpenJDK 阅读源码,下面是它的链接地址。
http://hg.openjdk.java.net/jdk8u/jdk8u/jdk/file/35818757a9c6/src/share/native/java/lang/Object.c
这里就不解释 C 实现的源码了,我们直接看一下源码中关于这个方法的注释。
hashCode() 就是以该实例对象的内存地址作为依据返回一个整数。
如果你没有重写 hashCode() 方法的话,那么两个对象调用 hashCode() 方法的返回值无论如何都不可能相等,因为这是根据两个不同的内存地址计算得来的值。
二、equals()
public boolean equals(Object obj) {
return (this == obj);
}
我们知道,对于基本数据类型 “==” 运算符比较的就是数值是否相等,而对于引用类型,它比较的就是这两个引用是否引用的是同一个对象,你可以将引用理解为指向内存地址的指针,如果不重写 equals() 方法的话,那么调用这个方法是无论如何都不可能返回 true 的。
HashSet/HashMap 如何判断两个对象是否相等
我们先来看一下 HashSet 的源码,我只贴出几个比较有意思的地方
private transient HashMap<E,Object> map;