首先,想要明白hashCode的作用,必须要先知道Java中的集合。
总的来说,Java中的集合(Collection)有两类,一类是List,再有一类是Set。 前者集合内的元素是有序的,元素可以重复;后者元素无序,但元素不可重复。
那么这里就有一个比较严重的问题了:要想保证元素不重复,可两个元素是否重复应该依据什么来判断呢? 这就是Object.equals方法了。但是,如果每增加一个元素就检查一次,那么当元素很多时,后添加到集合中的元素比较的次数就非常多了。 也就是说,如果集合中现在已经有1000个元素,那么第1001个元素加入集合时,它就要调用1000次equals方法。这显然会大大降低效率。
于是,Java采用了哈希表的原理。哈希(Hash)实际上是个人名,由于他提出一哈希算法的概念,所以就以他的名字命名了。 哈希算法也称为散列算法,是将数据依特定算法直接指定到一个地址上。初学者可以这样理解,hashCode方法实际上返回的就是对象存储的物理地址(实际可能并不是)。
这样一来,当集合要添加新的元素时,先调用这个元素的hashCode方法,就一下子能定位到它应该放置的物理位置上。 如果这个位置上没有元素,它就可以直接存储在这个位置上,不用再进行任何比较了;如果这个位置上已经有元素了, 就调用它的equals方法与新元素进行比较,相同的话就不存了,不相同就散列其它的地址。 所以这里存在一个冲突解决的问题。这样一来实际调用equals方法的次数就大大降低了,几乎只需要一两次。
所以,Java对于eqauls方法和hashCode方法是这样规定的:
1、如果两个对象相同,那么它们的hashCode值一定要相同;
2、如果两个对象的hashCode相同,它们并不一定相同(上面说的对象相同指的是用eqauls方法比较。)
那么问题就来了,如何保证在equal=true时,hashcode一定相等呢?
这就要借鉴String中hashcode的生成原理了
* @return a hash code value for this object.
*/
public int hashCode() {
int h = hash;
if (h == 0 && value.length > 0) {
char val[] = value;
for (int i = 0; i < value.length; i++) {
h = 31 * h + val[i];
}
hash = h;
}
return h;
}举个例子吧:
package ray.test;
public class User {
private String name;
private int age;
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public int getAge() {
return age;
}
public void setAge(int age) {
this.age = age;
}
@Override
public boolean equals(Object obj) {
// 如果地址相等,则肯定相等
if (this == obj) {
return true;
}
if (getClass() != obj.getClass()) { // if(obj instanceof User){
return false;
}
User u = (User) obj;
if (this.age != u.age) {
return false;
}
if (this.name == null) {
if (u.name != null) {
return false;
}
} else if (!this.name.equals(u.name)) {
return false;
}
return true;
}
@Override
public int hashCode() {
final int prime = 31;
int result = 1;
result = prime * result + age;
result = prime * result + (name == null ? 0 : name.hashCode());
return result;
}
}
这里需要注意的是: 在计算hashCode的时候,用到了属性age,有些collection在remove对象的时候,会判断hashcode(看remove 的源码就知道)
所以当我们在remove对象的时候,有时候就不能修改参加技术hashcode的属性的值,否则hashcode就对不上了。造成内存泄漏:
举个例子:
package ray.test;
import java.util.HashSet;
import java.util.LinkedList;
import java.util.List;
public class Main {
public static void main(String[] args) {
List<User> list = new LinkedList<User>();
HashSet<User> set = new HashSet<User>();
User user1 = new User();
user1.setAge(10);
user1.setName("雷梓诺");
list.add(user1);
set.add(user1);
User user2 = new User();
user2.setAge(12);
user2.setName("雷梓诺");
list.add(user2);
set.add(user2);
System.out.println("是否equeal:"+user1.equals(user2));
System.out.println("hashcode是否相等:"+(user1.hashCode() == user2.hashCode()));
//删除前后set的size没有变化,造成内存泄漏
System.out.println("set删除前:set size = "+ set.size());
user1.setAge(11);
set.remove(user1);
System.out.println("set删除后:set size = "+ set.size());
//不会造成内存泄漏
System.out.println("list删除前:List size = "+ list.size());
user1.setAge(11);
list.remove(user1);
System.out.println("list删除后:List size = "+ list.size());
}
}
是否equeal:false
hashcode是否相等:false
set删除前:set size = 2
set删除后:set size = 2
list删除前:List size = 2
list删除后:List size = 1
本文深入探讨了Java中hashCode与equals方法的重要性和实现原理,解释了如何通过正确实现这两个方法来提高集合操作的效率,避免内存泄漏等问题。
189

被折叠的 条评论
为什么被折叠?



