找了容量为27万中文词库进行试验
CRC32 中冲突率 < 0.01%
而 Java.HashCode 有 4%
hashCode 的速度 应该比 CRC 快 2-3 倍
CRC 实际上就是求余数,
1)被除数是确定好的,被除数首位要求是1(可以理解,因为0,就相当于会少一位),尾数也要求是1(为何)
2)CRC8 是指余数是8位,那么被除数就是9位,CRC16,被除数17位,32那么被除数应该是33位了
3)CRC采用不借位,不进位的加减法,所有都变成了异或操作
4)利用异或交换率,CRC可以由计算法改为查表法提高效率
Java 的HashCode
java String hashCode 的算法
s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]
using
CRC32 中冲突率 < 0.01%
而 Java.HashCode 有 4%
hashCode 的速度 应该比 CRC 快 2-3 倍
CRC 实际上就是求余数,
1)被除数是确定好的,被除数首位要求是1(可以理解,因为0,就相当于会少一位),尾数也要求是1(为何)
2)CRC8 是指余数是8位,那么被除数就是9位,CRC16,被除数17位,32那么被除数应该是33位了
3)CRC采用不借位,不进位的加减法,所有都变成了异或操作
4)利用异或交换率,CRC可以由计算法改为查表法提高效率
Java 的HashCode
java String hashCode 的算法
s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]
using
int arithmetic,
where s[i] is the ith
character of the string, n is the length of
the string, and ^ indicates exponentiation.
(The hash value of the empty string is zero.)
本文通过实验对比了CRC32与Java HashCode两种算法在27万中文词库上的冲突率及速度表现,并详细介绍了CRC的工作原理及Java String hashCode的计算方式。
1962

被折叠的 条评论
为什么被折叠?



