默认情况下,Object中的hashCode() 返回对象的32位jvm内存地址。
重写equals():
public boolean equals(Object o) {
if(o == null)
{
return false;
}
if (o == this)
{
return true;
}
if (getClass() != o.getClass())
{
return false;
}
Employee e = (Employee) o;
return (this.getId() == e.getId());
}
在子类中定义equals时首先调用超类的equals,如果检测失败就不可能相等。如果超类中的域都相等,就要比较子类中的实例域:
public class Manager extends Employee{
<span style="white-space:pre"> </span>public boolean equals(Object o){
<span style="white-space:pre"> </span>if(!super.equals(o))<span style="white-space:pre"> </span>return false;
<span style="white-space:pre"> </span>Manager obj=(Manager) o;
<span style="white-space:pre"> </span>return this.bonus==obj.bonus;
<span style="white-space:pre"> </span>}
}
许多人喜欢用if(!o instanceof Employee)
return false;
例如employee.equals(manager),如果用instanceof,则会返回true,根据对称性原则manager.equals(employee)也要返回true,但会对Manager的equals方法有限制,需要忽略Manager的特殊性。即manager必须能使他与任何employee比较
使用getClass:只要对应的域相等,就认为两个对象相等。在经理与雇员的例子中,姓名、薪水等域都相等,但奖金不等,就认为他们不等
使用instanceof:假设使用雇员的id作为判断相等的标准,并且这个标准试用于所有子类。并应该讲Employee.equals()设置成final
所以,优化:
public boolean equals(Object o) {
if(o == null) //显式对象是否为空
{
return false;
}
<pre name="code" class="javascript"> if (o == this) //两个对象是引用同一个对象
{
return true;
}
//下面这两个根据需要选择其一 if (getClass() != o.getClass()) //是否属于同一类,如果equals语义在子类中有所改变就使用getClass { return false; }if(!o instanceof Employee)return false;//如果所有子类的语义都相等,则用instanceof,java 中的instanceof 运算符是用来在运行时指出对象是否是特定类的一个实例Employee e = (Employee) o; //对所有需要比较的域进行比较,基本类型用==,对象域用equalsreturn this.getId() == e.getId()&&this.fields.equals(e.fields);}
而HashSet等还需要重写hashCode,因为Set中不能有重复元素
public int hashCode()
{
final int PRIME = 31;
int result = 1;
result = PRIME * result + getId();
return result;
}
Apache Commons 包提供了两个非常优秀的类来生成hashCode()和equals()方法。看下面的程序。
import org.apache.commons.lang3.builder.EqualsBuilder;
import org.apache.commons.lang3.builder.HashCodeBuilder;
@Override
public int hashCode()
{
final int PRIME = 31;
return new HashCodeBuilder(getId()%2==0?getId()+1:getId(), PRIME).
toHashCode();
}
@Override
public boolean equals(Object o) {
if (o == null)
return false;
if (o == this)
return true;
if (o.getClass() != getClass())
return false;
Employee e = (Employee) o;
return new EqualsBuilder().
append(getId(), e.getId()).
isEquals();
}
hash散列算法,使得在hash表中查找一个记录速度变O(1). 每个记录都有自己的hashcode,散列算法按照hashcode把记录放置在合适的位置. 在查找一个记录,首先先通过hashcode快速定位记录的位置.然后再通过equals来比较是否相等. 没有hashcode,一个一个比较过来,时间就变O(N)了。
一个set有一万个元素,再加入一个不同的新元素,则需要执行一万次的equal方法,这个效率太低了。所以采用先比较hashcode,由于是64位整数,可以建立索引查找。如果hashcode没找到,则必定不equal,加入set当中;即使找到了,也只需执行hashcode相同的几个元素的equal。这是一种性能设计。
hashCode()方法要求:
当对象状态未改变即不论第几次调用,那么多次调用返回的值必须相等
两个对象equals为true,则hashCode()的返回值一定相等;equals为false,hashCode()可能相等可能不等
两个对象hashCode()相等,equals可能相等可能不等;hashCode()不等,equals一定不相等
equals()方法要求:自反性:x.equals(x)为true
对称性:若x.equals(y)为true,则y.equals(x)为true
传递性:若x.equals(y)为true,y.equals(z)为true,则x.equals(z)为true
一致性:若x、y没有变,不论多少次调用x.equals(y),结果都相同
对任何不为null的x,x.equals(null)为false
在一般的应用中你不需要了解hashCode的用法,但当你用到HashMap,HashSet等集合类时要注意下hashCode。
你想通过一个object的key来拿HashMap的value,HashMap的工作方法是,通过你传入的object的hashcode在内存中找地址,当找到这个地址后再通过equals方法来比较这个地址中的内容是否和你原来放进去的一样,一样就取出value。
hashCode()方法使用来提高Map里面的搜索效率的,Map会根据不同的hashCode()来放在不同的桶里面,Map在搜索一个对象的时候先通过hashCode()找到相应的桶,然后再根据equals()方法找到相应的对象.要正确的实现Map里面查找元素必须满足一下两个条件:
(1)当obj1.equals(obj2)为true时obj1.hashCode() == obj2.hashCode()必须为true
(2)当obj1.hashCode() != obj2.hashCode()为true时obj.equals(obj2)必须为false
1、 为什么要重载equal方法?
因为Object的equal方法默认是两个对象的引用的比较,意思就是指向同一内存,地址则相等,否则不相等;如果你现在需要利用对象里面的值来判断是否相等,则重载equal方法。
2、 为什么重载hashCode方法?
一般的地方不需要重载hashCode,只有当类需要放在HashTable、HashMap、HashSet等等hash结构的集合时才会重载hashCode,那么为什么要重载hashCode呢?就HashMap来说,好比HashMap就是一个大内存块,里面有很多小内存块,小内存块里面是一系列的对象,可以利用hashCode来查找小内存块hashCode%size(小内存块数量),所以当equal相等时,hashCode必须相等,而且如果是object对象,必须重载hashCode和equal方法。
3、 为什么equals()相等,hashCode就一定要相等,而hashCode相等,却不要求equals相等?
(1)、因为是按照hashCode来访问小内存块,所以hashCode必须相等
(2)、HashMap获取一个对象是比较key的hashCode相等和equal为true。
hashCode()方法在重写时,通常按照以下设计原则实现:
1. 把某个非零常数值,例如17,保存在int类型变量result中。
2. 对对象中每一个关键域f(指在equals()方法中考虑的每一个域)参照以下原则处理:
- boolean型,计算(f ? 0 : 1);
- byte、char、和short型,计算(int);
- long型,计算(int)(f^(f>>>32));
- float型,计算Double.doubleToLongBits(double域名称)得到一个long域,再执行long的处理;
- 对象类型,递归调用它的hashCode()方法;
- 数组域,对其中每个元素调用他的hashCode()方法。
3. 将上面计算的到的散列码保存到int型变量c,再执行result=37*result+c。
4. 返回resul。
重写hashCode()方法的实例代码如下:
public class Person { private String id; private String name; public String getId() { return id; } public String getName() { return name; } //覆盖equals方法 public boolean equals(Object o) { if(o == null) { return false; } if(this == o) { return true; } if(this.getClass() != o.getClass()) { return false; } Person p = (Person)o; return id.equals(p.getId()) && name.equals(p.getName()); } }
先看下java源码中对hashcode()方法里面用到的变量的声明。也是String类中的变量
- private final char value[];//定义一个字符数组value,用于存储字符串里面的字符,所以字符串不可变
- private final int offset;//定义offset变量表示字符串第一个字符的下标索引
- private final int count;//定义count变量表示字符串中字符的个数
- private int hash; // Default to 0,默认值为0
下面就是hashcode()方法的源码
- public int hashCode() {
- int h = hash;
- if (h == 0 && count > 0) {
- int off = offset;
- char val[] = value;
- int len = count;
- for (int i = 0; i < len; i++) {
- h = 31*h + val[off++];
- }
- hash = h;
- }
- return h;
- }
下面以cat为例。根据hashcode()源码中的循环部分的算法,计算一下cat的hashcode值
首先,c,a,t 的ascii码值分别为99,97,116;字符个数3,所以循环部分的代码变成如下所示
- public int hashCode() {
- int h = hash;
- if (h == 0 && count > 0) {
- int off = 0;
- char val[] = value;
- int len = 3;
- for (int i = 0; i < 3; i++) {
- h = 31*h + val[off++];
- }
- hash = h;
- }
- return h;
- }
也就是总共3次循环
第一次循环:h1=31*0+val[0]=val[0]='c'=99
第二次循环:h2=31*h1+val[1]=31*99+'a'=31*99+97=3166
第三次循环:h3=31*h2+val[2]=31*3166+'t'=31*3166+116=98262
所以cat的hashcode值为98262
再用多项式的表示方法检验一下s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]
99*31的平方+97*31+116结果也等于98262
所以计算正确。
看下面的例子,没有重写hashCode方法的类,直接返回32位对象在JVM中的地址;Long类重写了hashCode方法,返回计算出的hashCode数值:
public class ComHashcode{
public static void main(String[] args) throws Exception {
ComHashcode a = new ComHashcode();
ComHashcode b = new ComHashcode();
System.out.println(a.hashCode()); //870919696
System.out.println(b.hashCode()); //298792720
Long num1 = new Long(8);
Long num2 = new Long(8);
System.out.println(num1.hashCode()); //8
System.out.println(num2.hashCode()); //8
}
}
- hashcode方法返回该对象的哈希码值。支持该方法是为哈希表提供一些优点,例如,java.util.Hashtable 提供的哈希表。
- hashCode 的常规协定是:
- 在 Java 应用程序执行期间,在同一对象上多次调用 hashCode 方法时,必须一致地返回相同的整数,前提是对象上 equals 比较中所用的信息没有被修改。从某一应用程序的一次执行到同一应用程序的另一次执行,该整数无需保持一致。
- 如果根据 equals(Object) 方法,两个对象是相等的,那么在两个对象中的每个对象上调用 hashCode 方法都必须生成相同的整数结果。
- 以下情况不 是必需的:如果根据 equals(java.lang.Object) 方法,两个对象不相等,那么在两个对象中的任一对象上调用 hashCode 方法必定会生成不同的整数结果。但是,程序员应该知道,为不相等的对象生成不同整数结果可以提高哈希表的性能。
- 实际上,由 Object 类定义的 hashCode 方法确实会针对不同的对象返回不同的整数。(这一般是通过将该对象的内部地址转换成一个整数来实现的,但是 JavaTM 编程语言不需要这种实现技巧。)
- 当equals方法被重写时,通常有必要重写 hashCode 方法,以维护 hashCode 方法的常规协定,该协定声明相等对象必须具有相等的哈希码。
以上这段官方文档的定义,我们可以抽出成以下几个关键点:
1、hashCode的存在主要是用于查找的快捷性,如Hashtable,HashMap等,hashCode是用来在散列存储结构中确定对象的存储地址的;
2、如果两个对象相同,就是适用于equals(java.lang.Object) 方法,那么这两个对象的hashCode一定要相同;
3、如果对象的equals方法被重写,那么对象的hashCode也尽量重写,并且产生hashCode使用的对象,一定要和equals方法中使用的一致,否则就会违反上面提到的第2点;
4、两个对象的hashCode相同,并不一定表示两个对象就相同,也就是不一定适用于equals(java.lang.Object) 方法,只能够说明这两个对象在散列存储结构中,如Hashtable,他们“存放在同一个篮子里”。
再归纳一下就是hashCode是用于查找使用的,而equals是用于比较两个对象的是否相等的。以下这段话是从别人帖子回复拷贝过来的:
- 1.hashcode是用来查找的,如果你学过数据结构就应该知道,在查找和排序这一章有
- 例如内存中有这样的位置
- 0 1 2 3 4 5 6 7
- 而我有个类,这个类有个字段叫ID,我要把这个类存放在以上8个位置之一,如果不用hashcode而任意存放,那么当查找时就需要到这八个位置里挨个去找,或者用二分法一类的算法。
- 但如果用hashcode那就会使效率提高很多。
- 我们这个类中有个字段叫ID,那么我们就定义我们的hashcode为ID%8,然后把我们的类存放在取得得余数那个位置。比如我们的ID为9,9除8的余数为1,那么我们就把该类存在1这个位置,如果ID是13,求得的余数是5,那么我们就把该类放在5这个位置。这样,以后在查找该类时就可以通过ID除 8求余数直接找到存放的位置了。
- 2.但是如果两个类有相同的hashcode怎么办那(我们假设上面的类的ID不是唯一的),例如9除以8和17除以8的余数都是1,那么这是不是合法的,回答是:可以这样。那么如何判断呢?在这个时候就需要定义 equals了。
- 也就是说,我们先通过 hashcode来判断两个类是否存放某个桶里,但这个桶里可能有很多类,那么我们就需要再通过 equals 来在这个桶里找到我们要的类。
- 那么。重写了equals(),为什么还要重写hashCode()呢?
- 想想,你要在一个桶里找东西,你必须先要找到这个桶啊,你不通过重写hashcode()来找到桶,光重写equals()有什么用啊
附加hashcode和equals的标准写法:
- @Override
- public int hashCode() {
- final int prime = 31;
- int result = 1;
- result = prime * result + ((name == null) ? 0 : name.hashCode());
- result = prime * result + ((address == null) ? 0 : address.hashCode());
- result = prime * result + ((number == null) ? 0 : number.hashCode());
- return result;
- }
- @Override
- public boolean equals(Object obj) {
- if (this == obj) {
- return true;
- }
- if (obj == null) {
- return false;
- }
- if(getClass() != obj.getClass()) {
- return false;
- }
- Person p = (Person)obj;
- if (name == null) {
- if(p.name != null) {
- return false;
- }
- } else if (!name.equals(p.name)) {
- return false;
- }
- if (address == null) {
- if (p.address != null) {
- return false;
- }
- } else if (!address.equals(p.address)) {
- return false;
- }
- if (number == null) {
- if (p.number != null) {
- return false;
- }
- } else if (!number.equals(p.number)) {
- return false;
- }
- return true;
- }
if (o == this) //两个对象是引用同一个对象
{
return true;
}