C# 重写Equals()方法
最近在学习C#时遇到了关于重写Equals()方法的内容,感觉是一个很重要的内容,在这里做一个学习笔记。
第一次使用Markdown写文章,如有疏忽,请见谅。
目录
重写 GetHashCode()方法
Hash Code是什么
散列码(Hash Code)的作用是生成和对象相对应的值。
散列函数把消息或数据压缩成摘要,使得数据量变小,将数据的格式固定下来。该函数将数据打乱混合,重新创建一个叫做散列值的列表。散列值通常用来代表一个短的随机字母和数字组成的字符串。——[中文维基](https://zh.wikipedia.org/wiki/%E6%95%A3%E5%88%97%E5%87%BD%E6%95%B8)
为什么重写Equals()方法必须要GetHashCode()
相同的对象的散列码必然是相同的,但是反之不然,散列码相同的两个对象不一定是相同的,有可能对象的数目比散列码的数目,造成了一对多的映射,因此在C#中不要用散列码作为判断两个对象相同的唯一依据,但是可以用作判断两个对象不相同的依据。
如果类不改写GetHashCode()
对于引用类型,只有当引用相同时,才会返回相同的散列码。很多时候我们会遇到这样的情况,例化了两个一模一样的实例,但是他们的引用不一样的,他们的散列码就不一样。
对于值类型,这种情况会好很多,两个对象值相同,类型相同,就会返回相同的散列码。(PS:相同的值但是类型不同,散列码会不一样)
HashCode的实现原则
1. 相等的对象必须有相等的散列码(**Must**)
2. 特定在对象的生存期内,GetHashCode()始终要返回相同的值(__Must__)
3. GetHashCode()不允许引发任何异常,方法总是可以成功的返回一个值(**Must**)
4. 散列码尽可能唯一(**To the best**)
5. 散列码尽可能在int范围内平均分布(**To the best**)
6. GetHashCode()尽可能优化,因为会非常频繁的调用它,在实际的Equals()方法中,用GetHashCode()方法首先判断两个对象是否相同(**To the Best**)
7. 两个对象的细微差异应当造成散列码值得极大差异。理想情况下1位的差异应造成散列码16位的不同。通常用按位异或操作生成散列码。(**To the best**)
8. 攻击者应当难以伪造具有特定散列码的对象,即使知道了散列码,很难反推出对象。(**For safety**)
Example
public class Person
{
public Person (string name,string sex,int age,int id)
{
Name = name;
Sex = sex;
Age = age;
Id = id;
}
public string Name {
get ;set ;}
public string Sex {
get ;set ;}
public int Age {
get ;set ;}
public readonly id;
public override int GetHashCode ()
{
int hashCode = Name.GetHashCode();
hashCode ^= Sex.GetHashCode();
hashCode ^= Age.GetHashCode();
hashCode ^= (int )Id^(int )(Id >> 32 );
return hashCode;
}
}
重写Equals()方法
ReferenceEquals()方法和Equals()方法
ReferenceEquals()方法
1. 不能被重写
2. 当对象引用相同时,返回true,否则返回false
3. 值类型调用该方法永远返回false。
值类型调用该方法时先进行装箱,之后引用就不一样的
Example
int a = 5
int b = 5
if (a .ReferenceEquals(b))
{
Console.WriteLine("a({0} DOES reference equal to b({1}))" ,a ,b)
}
else
{
Console.WriteLine("a({0}) does NOT reference equal to b({1})" ,a<