前两天写了几篇关于Hash函数和HashMap集合的文章,其中有个问题说的有点含糊 就是关于hashCode的
计算为什么采用31这个数作为乘数的问题
。
当时强硬的理解为31 这个数值原因为:
- 首先hash函数必须要选用质数(质数定义为在大于1的自然数中,除了1和它本身以外不再有其他因数又称为素数),这个是被科学家论证过的hash函数减少冲突的一个理论。
- 如果设置为偶数的话会存在溢出的情况,导致信息丢失(因为使用偶数相当于使用了移位运算)
- 可以兼顾到虚拟机的性能,虚拟机默认使用2<<5-1 来的到很好的性能,且其是一个不大不小的质数,兼顾了性能和冲突率
那么问题就来了 是不是有相同的奇素数可以替代31的呢?答案是:有
既然是奇素数,那么自然有相近的如3,17,31,101等,为什么31的性能和解决冲突是最优的呢我们下面就在进行分解分解
我们在来回顾一下String对象的HashCode方法
/**
* Returns a hash code for this string. The hash code for a
* {@code String} object is computed as
* <blockquote><pre>
* s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]
* </pre></blockquote>
* using {@code int} arithmetic, where {@code s[i]} is the
* <i>i</i>th character of the string, {@code n} is the length of
* the string, and {@code ^} indicates exponentiation.
* (The hash value of