100%会用到的hashCode()和equals()方法及使用规范,你掌握了吗?

背景

在看阿里巴巴Java开发手册手册时,看到了有关hashCode()和equals()方法的使用规范。

  • 只要重写 equals,就必须重写 hashCode。

  • 因为 Set 存储的是不重复的对象,依据 hashCode 和 equals 进行判断,所以 Set 存储的对象必须重写这两个方法。

  • 如果自定义对象做为 Map 的键,那么必须重写 hashCode 和 equals。

并且举了String 重写了 hashCode 和 equals 方法,所以我们可以非常愉快地使用 String 对象作为 key 来使用的例子。

我们看下String的hashCode()和equals()的源码:

 

String的hashCode()

hashCode():


    private int hash; // Default to 0
    public int hashCode() {
        int h = hash;
        if (h == 0 && value.length > 0) {
            char val[] = value;

            for (int i = 0; i < value.length; i++) {
                h = 31 * h + val[i];
            }
            hash = h;
        }
        return h;
    }

代码就不一行一行的解释了,单纯的从代码角度上来说,我们也可以学到一些知识点。

  • 缓存的重要性,这里的value属性就作为了缓存。

  • 大多数情况下缓存是在使用时生成的。

  • 计算hash时可以用类本身的属性的值与31乘积。

为什么是31,而不是32,33等其他数字呢?

  • 31是一个素数,素数作用就是如果我用一个数字来乘以这个素数,那么最终的出来的结果只能被素数本身和被乘数还有1来整除。

  • 31可以由i*31 == (i<<5)-1来表示,现在很多虚拟机里面都有做相关优化。

  • 选择系数的时候要选择尽量大的系数。因为如果计算出来的hash地址越大,所谓的“冲突”就越少,查找起来效率也会提高。

  • 并且31只占用5bits,相乘造成数据溢出的概率较小。

后面再说hashCode的设计原则,继续介绍equals()方法。

 

String的equals()

 public boolean equals(Object anObject) {
        if (this == anObject) {
            return true;
        }
        if (anObject instanceof String) {
            String anotherString = (String)anObject;
            int n = value.length;
            if (n == anotherString.value.length) {
                char v1[] = value;
                char v2[] = anotherString.value;
                int i = 0;
                while (n-- != 0) {
                    if (v1[i] != v2[i])
                        return false;
                    i++;
                }
                return true;
            }
        }
        return false;
    }

equals方法就没有什么好说的,为什么要这么写,这里就跟equals的设计原则有关了,后续会解释。下面我们从开发者手册的三句话来解释hashCode和equals方法的特性,以及为什么要重新这两个方法。

 

 

只要重写equals,就必须重写hashCode

我们先举个例子: Person类:

public class Person {
    private String name;
    private int age;

    public Person() {
    }

    public Person(String name, int age) {
        this.name = name;
        this.age = age;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public int getAge() {
        return age;
    }

    public void setAge(int age) {
        this.age = age;
    }
    @Override
    public boolean equals(Object o){
        if(this == o){
            return true;
        }
        if(o instanceof Person){
            Person p = (Person)o;
            return this.age == p.getAge() && this.name.equals(p.getName());
        }
        return false;
    }
}

运行类:

public class Application {
    public static void main(String[]args){
        Set<Person> set = new HashSet<>();
        Person p1 = new Person("Lilei", 25);
        Person p2 = new Person("Lilei", 25);
        set.add(p1);
        System.out.println("p1 equals p2: " + (p1 == p2));//1
        System.out.println("set contains p1: " + set.contains(p1));//2
        System.out.println("set contains p2: " + set.contains(p2));//3
    }
}

输出结果:

p1 equals p2: false
set contains p1: true
set contains p2: false

可以看出来p1虽然等于p2(我们重写了Person类的equals方法),但是把p1放入一个Set之后,通过p2是无法取出来的,但是我们要的效果是能通过p2取出来,现实中肯定是有这样的使用场景的。

 

因为 Set 存储的是不重复的对象,依据 hashCode 和 equals 进行判断,所以 Set 存储的对象必须重写这两个方法

还是上面的例子,我们不重写Person类的equals方法,也不重写它的hashCode方法。Person类:

public class Person {
    private String name;
    private int age;

    public Person() {
    }

    public Person(String name, int age) {
        this.name = name;
        this.age = age;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public int getAge() {
        return age;
    }

    public void setAge(int age) {
        this.age = age;
    }
}

运行类:

public class Application {
    public static void main(String[]args){
        Set<Person> set = new HashSet<>();
        Person p1 = new Person("Lilei", 25);
        Person p2 = new Person("Lilei", 25);
        set.add(p1);
        set.add(p2);
        System.out.println("set size is: " + set.size());
        //System.out.println("p1 equals p2: " + (p1 == p2));
        //System.out.println("set contains p1: " + set.contains(p1));
        //System.out.println("set contains p2: " + set.contains(p2));

    }
}

运行结果:

set size is: 2

Set里面是不重复的,如果不重写Person类的hashCode和equals方法,这里p1和p2是可以同时放入Set对象里的。那么我们只重写了Person的hashCode方法能不能行呢?

@Override
    public int hashCode(){
        return name.hashCode() * 31 + age;
    }

运行结果:

set size is: 2

最后重写Person类的equals()方法:

 @Override
    public boolean equals(Object o){
        if(this == o){
            return true;
        }
        if(o instanceof Person){
            Person p = (Person)o;
            return this.age == p.getAge() && this.name.equals(p.getName());
        }
        return false;
    }

    @Override
    public int hashCode(){
        return name.hashCode() * 31 + age;
    }

运行结果:

set size is: 1

 

 

如果自定义对象做为 Map 的键,那么必须重写 hashCode() 和 equals()

这一点和第二点实际上是一样的,这里就不举例介绍了。 
实际上,Set的对象和Map的key的操作和hashCode以及equals方法有关,比如查这个对象是否在Set里,先根据hashCode定位到一个段,在根据equals进行确定是否存在,这样不需要把Set里所有的对象都遍历一遍,效率太低,Map的key是同样道理。

那么hashCode和equals的设计原则就呼之欲出了。

 

equals()的设计原则

  • 对称性: 如果x.equals(y)返回是true,那么y.equals(x)也应该返回是true。

  • 反射性: x.equals(x)必须返回是true。

  • 类推性: 如果x.equals(y)返回是true,而且y.equals(z)返回是true,那么z.equals(x)也应该返回是true。

  • 一致性: 如果x.equals(y)返回是true,只要x和y内容一直不变,不管你重复x.equals(y)多少次,返回都是true。

  • 非空性: x.equals(null),永远返回是false;x.equals(和x不同类型的对象)永远返回是false。

 

hashCode()的设计原则

  • 在一个Java应用的执行期间,如果一个对象提供给equals做比较的信息没有被修改的话,该对象多次调用hashCode()方法,该方法必须始终如一返回同一个integer。

  • 如果两个对象根据equals(Object)方法是相等的,那么调用二者各自的hashCode()方法必须产生同一个integer结果。

  • 并不要求根据equals(java.lang.Object)方法不相等的两个对象,调用二者各自的hashCode()方法必须产生不同的integer结果。然而,程序员应该意识到对于不同的对象产生不同的integer结果,有可能会提高hash table的性能。

 

 

这些年做Java开发我整理了一份完整的java的系统化资料,从Javase- ssm-springcloud,包括了面试题,PDF电子书等等,以及我自身之前的一个面试文案和知识点补充,如果你需要一本全面的Java书,如果你想学习Java,如果你想找到一份好的工作,那么缘分就来了,有需要的朋友可以加我的QQ学习交流裙   735721532这里也祝愿大家最终都能够学有所成,早日找到满意的工作!

<think>我们之前讨论了为什么Stream流对List中的自定义对象无法直接去重,原因在于默认的equals方法比较的是内存地址。用户现在进一步提问:在重写了hashCodeequals方法后,为什么仍然无法去重? 根据用户提供的引用,特别是引用[2]中的代码示例,他们重写了equalshashCode方法,但用户反映仍无法去重。我们需要分析可能的原因。 ### 可能原因分析: 1. **equalshashCode重写不正确**:虽然重写了,但可能逻辑有误,例如只根据部分字段判断相等性,而实际需求可能是根据多个字段。 - 引用[2]中的例子只根据phone字段判断相等性,如果实际需求是根据多个字段(如phoneage),那么仅用phone就不够。 2. **hashCodeequals的契约未遵守**:根据引用[4],hashCode的约定是:如果两个对象相等(根据equals方法),那么它们的hashCode必须相等。反之,hashCode相等,对象不一定相等。如果重写的hashCode方法没有正确反映equals方法,则可能导致问题。 3. **Stream的distinct()实现原理**:引用[3]指出,distinct()是一个有状态操作,它内部使用HashSet来记录已出现的元素。因此,它依赖于元素的hashCodeequals方法。如果这两个方法重写不正确,distinct()就无法正确去重。 4. **对象可变性**:如果去重过程中对象的字段被修改,导致hashCode变化,那么HashSet中的存储就会混乱。因为HashSet依赖hashCode来定位桶,如果对象在存入HashSet后被修改,可能会导致无法正确识别重复。 5. **并行流处理问题**:如果使用并行流,distinct()操作可能因为并发问题而导致去重不准确。但这种情况较少见,通常distinct()在并行流中也是安全的,因为它使用了并发集合(如ConcurrentHashMap)?引用[3]提到distinct()维护一个HashSet,但在并行流中,实际上使用的是ConcurrentHashMap(类似)来保证线程安全。然而,如果hashCodeequals方法不是线程安全的(比如依赖了可变的共享状态),则可能出问题。 ### 重点排查步骤: 根据用户描述,他们已经重写了hashCodeequals,但无效。那么,我们需要检查他们的重写是否满足以下条件: - **自反性**:x.equals(x) 必须返回true。 - **对称性**:如果x.equals(y)为true,则y.equals(x)也必须为true。 - **传递性**:如果x.equals(y)为true,y.equals(z)为true,则x.equals(z)必须为true。 - **一致性**:在对象没有被修改的情况下,多次调用equals应该返回相同的结果。 - **非空性**:x.equals(null) 必须返回false。 同时,hashCode必须满足: - 如果两个对象相等(equals返回true),则它们的hashCode必须相等。 - 如果两个对象不相等,不要求hashCode不同,但不同可以提高散列表性能。 ### 示例分析: 引用[2]中的重写: ```java @Override public boolean equals(Object object){ ImportResume importResume=(ImportResume)object; return phone.equals(importResume.phone); } @Override public int hashCode(){ String in = phone; return in.hashCode(); } ``` 这个重写只比较了phone字段。如果两个ImportResume对象的phone相同,就认为相等。但这里存在一个问题:没有检查对象是否为null,也没有检查类型是否匹配。更安全的写法应该是: ```java @Override public boolean equals(Object o) { if (this == o) return true; if (o == null || getClass() != o.getClass()) return false; ImportResume that = (ImportResume) o; return Objects.equals(phone, that.phone); } @Override public int hashCode() { return Objects.hash(phone); } ``` 如果用户没有正确使用Objects.equals(比如直接使用phone.equals(that.phone)),当phone为null时,会抛出NullPointerException。这可能导致在比较时出现异常,从而影响去重。 ### 其他可能原因: 1. **对象状态变化**:在流处理过程中,如果对象的phone字段被修改,那么同一个对象在流中的不同位置可能产生不同的hashCode,导致去重失败。 2. **流操作顺序**:distinct()是一个有状态中间操作,它依赖于流的顺序。如果流不是有序的(比如并行流且没有保证顺序),那么去重结果可能不稳定,但通常distinct()会保留顺序(在并行流中,合并多个子结果时,会保留每个子流中的顺序,但不同子流之间的顺序可能被打乱?实际上,distinct()在并行流中会保留首次出现的顺序,但具体实现可能复杂)。不过,只要equalshashCode正确,最终结果应该是去重的,只是顺序可能受影响。 ### 解决方案: 1. 确保重写的equalshashCode方法正确无误,推荐使用IDE自动生成或使用Objects.equalsObjects.hash。 2. 避免在流处理过程中修改对象的字段(特别是用于equalshashCode的字段)。 3. 检查是否使用了并行流,如果使用了,确保equalshashCode方法线程安全(通常它们应该是无副作用的,不依赖外部状态,且只读对象字段)。 ### 验证示例: 假设有一个正确的重写,但去重失败,我们可以写测试: ```java ImportResume r1 = new ImportResume(); r1.setPhone("123"); ImportResume r2 = new ImportResume(); r2.setPhone("123"); System.out.println(r1.equals(r2)); // 应该输出true System.out.println(r1.hashCode() == r2.hashCode()); // 应该输出true List<ImportResume> list = Arrays.asList(r1, r2); List<ImportResume> distinctList = list.stream().distinct().collect(Collectors.toList()); System.out.println(distinctList.size()); // 应该输出1 ``` 如果上述测试中,equalshashCode不满足,则去重失败。 ### 结论: 如果重写了hashCodeequals后仍然无法去重,最常见的原因是重写逻辑存在缺陷(如未正确处理null、未比较所有必要字段、违反equals契约等),或者在流处理过程中修改了对象状态。需要仔细检查重写方法对象在流中的使用情况。 根据引用[1][2][3][4]的分析,我们强调正确实现equalshashCode的重要性,并注意对象在流中的不可变性。 ### 相关问题: §§相关问题§§ 1. 如何正确重写Java中的equalshashCode方法? 2. 在Stream的distinct操作中,对象可变性会导致什么问题? 3. 并行流中使用distinct()需要注意什么? </think> ### 问题分析 在重写了 `hashCode()` `equals()` 方法后,Stream 流对 List 中的引用类型元素仍无法去重,通常由以下原因导致: --- ### 核心原因 #### 1. **`equals()` 方法实现逻辑错误** - **字段比较不完整**:若 `equals()` 未覆盖所有关键字段,内容相同的对象仍被视为不同。 ```java // 错误示例:仅比较部分字段 @Override public boolean equals(Object o) { if (this == o) return true; if (o == null || getClass() != o.getClass()) return false; User user = (User) o; return Objects.equals(id, user.id); // 忽略了 name 字段 } ``` - 当两个对象的 `id` 相同但 `name` 不同时,本应视为不同对象,但若 `name` 未参比较,可能导致误判为相同[^2]。 - **未处理 `null` 或类型检查**: ```java // 错误示例:缺少类型检查空指针处理 @Override public boolean equals(Object o) { User user = (User) o; // 直接强制转换,若 o 为 null 或非 User 类型会抛出异常 return this.id.equals(user.id); } ``` #### 2. **`hashCode()` `equals()` 未同步** - 违反 Java 规范:**若 `a.equals(b)==true`,则 `a.hashCode()==b.hashCode()` 必须成立**(引用[4])。 ```java @Override public int hashCode() { return id.hashCode(); // 仅用 id 生成哈希值 } @Override public boolean equals(Object o) { User user = (User) o; return this.id.equals(user.id) && this.name.equals(user.name); // 使用了 id+name } ``` - 当两个对象 `id` 相同但 `name` 不同时,`equals()` 返回 `false`,但 `hashCode()` 可能相同(仅依赖 `id`)。这导致 `distinct()` 在哈希冲突时错误判定为重复[^4]。 #### 3. **对象状态在流处理中被修改** - 若去重依赖的字段在流操作中被修改,会导致同一对象前后比较结果不一致: ```java List<User> users = Arrays.asList(new User("1", "A"), new User("1", "A")); users.stream() .peek(u -> u.setName("B")) // 修改字段 .distinct() // 修改后 equals 结果可能变化 .collect(Collectors.toList()); ``` #### 4. **并行流下的线程安全问题** - `distinct()` 在并行流中依赖 `ConcurrentHashMap` 去重(引用[3])。若 `equals()`/`hashCode()` 非线程安全(如依赖共享变量),或对象被并发修改,会导致结果不稳定[^3]。 --- ### 解决方案 #### ✅ 1. **严格遵循 `equals()` `hashCode()` 规范** ```java @Override public boolean equals(Object o) { if (this == o) return true; if (o == null || getClass() != o.getClass()) return false; User user = (User) o; // 比较所有关键字段,使用 Objects.equals 防 NullPointerException return Objects.equals(id, user.id) && Objects.equals(name, user.name); } @Override public int hashCode() { // 使用 equals() 相同的字段 return Objects.hash(id, name); } ``` #### ✅ 2. **避免在流操作中修改对象状态** - 将对象设为不可变(`final` 字段 + 无 `setter` 方法)。 #### ✅ 3. **使用自定义去重逻辑替代 `distinct()`** ```java // 按指定字段去重(避免修改原对象) public static <T> Predicate<T> distinctByKey(Function<? super T, Object> keyExtractor) { Map<Object, Boolean> seen = new ConcurrentHashMap<>(); return obj -> seen.putIfAbsent(keyExtractor.apply(obj), true) == null; } // 使用示例:按 id 去重 List<User> distinctUsers = users.stream() .filter(distinctByKey(User::getId)) .collect(Collectors.toList()); ``` --- ### 验证步骤 1. **单元测试 `equals()` `hashCode()`** ```java @Test void testEquality() { User u1 = new User("1", "Alice"); User u2 = new User("1", "Alice"); assertTrue(u1.equals(u2)); // 必须通过 assertEquals(u1.hashCode(), u2.hashCode()); // 必须通过 } ``` 2. **检查流操作中的对象可变性** - 确保流操作链中无 `peek()` 或 `map()` 修改关键字段。 --- ### 总结:根本原因对照表 | 现象 | 原因 | |----------------------|----------------------------------------------------------------------| | 重写后仍无法去重 | `equals()` 未覆盖全部关键字段 或 `hashCode()` 未同步 | | 并行流结果不稳定 | 对象被并发修改 或 `equals()`/`hashCode()` 非线程安全 | | 部分重复元素未被过滤 | 对象在流处理中被修改,导致前后状态不一致 | > **关键点**:去重失败本质是 **对象相等性逻辑未正确实现** 或 **对象状态在流中发生变化**(引用[1][2][3])。通过严格遵循规范使用不可变对象可彻底解决[^1][^2]。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值