题目描述:
在数据结构中,哈希函数是用来将一个字符串(或任何其他类型)转化为小于哈希表大小且大于等于零的整数。一个好的哈希函数可以尽可能少地产生冲突。一种广泛使用的哈希函数算法是使用数值33,假设任何字符串都是基于33的一个大整数,比如:
hashcode(“abcd”) = (ascii(a) * 33^3 + ascii(b) * 33^2 + ascii(c) *33 + ascii(d)) % HASH_SIZE
= (97* 33^3 + 98 * 33^2 + 99 * 33 +100) % HASH_SIZE
= 3595978 % HASH_SIZE
其中HASH_SIZE表示哈希表的大小(可以假设一个哈希表就是一个索引0 ~ HASH_SIZE-1的数组)。
给出一个字符串作为key和一个哈希表的大小,返回这个字符串的哈希值。
样例:
对于key=”abcd” 并且 size=100, 返回 78
难度:容易
思路解析:
由于题目已经给出了哈希算法,因此根据题目中的算法进行进行分析。
有以下几种不同情况,当分别输入不同字符串时,hashcode值分别为:
a 97%HASH_SIZE
ab (97*33+98 )%HASH_SIZE
abc (97*33^2+98*33+99) %HASH_SIZE
abcd (97* 33^3 + 98 * 33^2 + 99 * 33 +100) % HASH_SIZE
结合数学规律可得
代码实现:
public class Solution {
public static void main(String[] args){
String str = "abcd";
char[] key = str.toCharArray();
System.out.println(hashCode(key,100));
}
public static int hashCode(char[] key,int HASH_SIZE){
int hashcode = 0;
for(int i = 0;i < key.length;i ++){
hashcode = (hashcode*33 + (int)key[i])%HASH_SIZE;
}
return hashcode;
}
}
出现的问题:
在提交过程中,会报错,究其原因是当取较大值时,数字会溢出,因为int类型的范围不够,因此将int类型的hashcode变量改成long类型的即可解决。
修改后代码:
public static int hashCode(char[] key,int HASH_SIZE){
long hashcode = 0;
for(int i = 0;i < key.length;i ++){
hashcode = (hashcode*33 + (int)key[i])%HASH_SIZE;
}
return (int)hashcode;
}