java中hashCode方法与equals方法的用法

最新推荐文章于 2021-05-17 23:33:58 发布

原创最新推荐文章于 2021-05-17 23:33:58 发布 · 463 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#hashcode #equals

本文深入探讨了Java中hashCode与equals方法的重要性和实现原理，解释了如何通过正确实现这两个方法来提高集合操作的效率，避免内存泄漏等问题。

首先，想要明白hashCode的作用，必须要先知道Java中的集合。　　

总的来说，Java中的集合（Collection）有两类，一类是List，再有一类是Set。前者集合内的元素是有序的，元素可以重复；后者元素无序，但元素不可重复。

那么这里就有一个比较严重的问题了：要想保证元素不重复，可两个元素是否重复应该依据什么来判断呢？这就是Object.equals方法了。但是，如果每增加一个元素就检查一次，那么当元素很多时，后添加到集合中的元素比较的次数就非常多了。也就是说，如果集合中现在已经有1000个元素，那么第1001个元素加入集合时，它就要调用1000次equals方法。这显然会大大降低效率。

于是，Java采用了哈希表的原理。哈希（Hash）实际上是个人名，由于他提出一哈希算法的概念，所以就以他的名字命名了。哈希算法也称为散列算法，是将数据依特定算法直接指定到一个地址上。初学者可以这样理解，hashCode方法实际上返回的就是对象存储的物理地址（实际可能并不是）。

这样一来，当集合要添加新的元素时，先调用这个元素的hashCode方法，就一下子能定位到它应该放置的物理位置上。如果这个位置上没有元素，它就可以直接存储在这个位置上，不用再进行任何比较了；如果这个位置上已经有元素了，就调用它的equals方法与新元素进行比较，相同的话就不存了，不相同就散列其它的地址。所以这里存在一个冲突解决的问题。这样一来实际调用equals方法的次数就大大降低了，几乎只需要一两次。

所以，Java对于eqauls方法和hashCode方法是这样规定的：

1、如果两个对象相同，那么它们的hashCode值一定要相同；

2、如果两个对象的hashCode相同，它们并不一定相同（上面说的对象相同指的是用eqauls方法比较。）

那么问题就来了，如何保证在equal=true时，hashcode一定相等呢？

这就要借鉴String中hashcode的生成原理了

     * @return  a hash code value for this object.
     */
    public int hashCode() {
        int h = hash;
        if (h == 0 && value.length > 0) {
            char val[] = value;

            for (int i = 0; i < value.length; i++) {
                h = 31 * h + val[i];
            }
            hash = h;
        }
        return h;
    }

举个例子吧：

package ray.test;

public class User {
	private String name;
	private int age;

	public String getName() {
		return name;
	}

	public void setName(String name) {
		this.name = name;
	}

	public int getAge() {
		return age;
	}

	public void setAge(int age) {
		this.age = age;
	}

	@Override
	public boolean equals(Object obj) {
		// 如果地址相等，则肯定相等
		if (this == obj) {
			return true;
		}
		if (getClass() != obj.getClass()) { // if(obj instanceof User){
			return false;
		}
		User u = (User) obj;
		if (this.age != u.age) {
			return false;
		}
		if (this.name == null) {
			if (u.name != null) {
				return false;
			}
		} else if (!this.name.equals(u.name)) {
			return false;
		}
		return true;
	}

	@Override
	public int hashCode() {
		final int prime = 31;
		int result = 1;
		result = prime * result + age;
		result = prime * result + (name == null ? 0 : name.hashCode());
		return result;
	}
}

这里需要注意的是：在计算hashCode的时候，用到了属性age，有些collection在remove对象的时候，会判断hashcode（看remove 的源码就知道）

所以当我们在remove对象的时候，有时候就不能修改参加技术hashcode的属性的值，否则hashcode就对不上了。造成内存泄漏：

举个例子：

package ray.test;
import java.util.HashSet;
import java.util.LinkedList;
import java.util.List;
public class Main {
	public static void main(String[] args) {
		List<User> list = new LinkedList<User>();
		HashSet<User> set = new HashSet<User>();
		User user1 = new User();
		user1.setAge(10);
		user1.setName("雷梓诺");
		list.add(user1);
		set.add(user1);
		User user2 = new User();
		user2.setAge(12);
		user2.setName("雷梓诺");
		list.add(user2);
		set.add(user2);
		System.out.println("是否equeal："+user1.equals(user2));
		System.out.println("hashcode是否相等："+(user1.hashCode() == user2.hashCode()));
		//删除前后set的size没有变化，造成内存泄漏
		System.out.println("set删除前：set size = "+ set.size());
		user1.setAge(11);
		set.remove(user1);
		System.out.println("set删除后：set size = "+ set.size());
		//不会造成内存泄漏
		System.out.println("list删除前：List size = "+ list.size());
		user1.setAge(11);
		list.remove(user1);
		System.out.println("list删除后：List size = "+ list.size());
	}
}

是否equeal：false
hashcode是否相等：false
set删除前：set size = 2
set删除后：set size = 2
list删除前：List size = 2
list删除后：List size = 1