1.散列的定义及整数散列
给出N个正整数,再给出M个正整数。问这M个数中的每个数分别是否在N中出现过。(M,N不超过10的5次方)
思路:
设定一个bool型数组 hashTable[100010],hashTable[x]==true说明正整数x在N中出现过。一开始读入的时候就进行赋值为true(hashTable初始化为false)。时间复杂度O(N+M)
若要输出每个数出现的次数。把hashTable换成int型,输入为x时hashTable[x]++;
空间换时间:
直接把输入的数作为数组的下标来对这个数的性质进行统计。
2.字符串hash初步
将一个字符串映射为一个整数,使得该整数可以尽可能唯一地代表该字符串
1.字符串均由大写字母A~Z构成,把A~Z视为0~25,对应到了二十六进制。
int hashFunc(char s[],int len){
int id = 0;
for(int i=0;i<len;i++){
id = id*26 + (s[i]-'A');
}
return id;
}//转换成的最大整数是26的len次方-1
字符串很长的话 转换成的整数会很大
2.如果有小写字母,A~Z为0~25,a~z为26~51;五十二进制转换为十进制的问题。
for(int i=0;i<len;i++){
if(s[i]>='A'&&s[i]<='Z'){
id = id*52+(s[i]-'A');
}else if(s[i]>='a'&&s[i]<='z'){
id = id*52+(s[i]-'a')+26;
}
}
3.出现数字的解决办法
第一种: 增大进制数至62。
第二种:如果保证在字符串的末尾是确定个数的数字,前面英文字母部分还是按上面的思路转换为整数,再将末尾的数字直接拼上去。
eg:BCD转换为整数731。BCD4就是7314。
int hashFunc(char S[],int len){
int id=0;
for(int i=0;i<len-1;i++){
id=id*26+(S[i]-'A');
}
id = id*10 + (S[len-1]-'0');
return id;
}
eg:N个字符串(三个大写字母组成),再给出M个查询字符串。问每个查询字符串在N个字符串中出现的次数。
#include <cstdio>
const int maxn = 100;
char S[maxn][5],temp[5];
int hashTable[26*26*26+10];
int hashFunc(char S[],int len){
int id=0;
for(int i=0;i<len;i++){
id = id*26+(S[i]-'A');
}
return id;
}
int main(){
int n,m;
scanf("%d%d",&n,&m);
for(int i=0;i<n;i++){
scanf("%s",S[i]);
int id = hashFunc(S[i],3);//3是因为三个大写字母
hashTable[id]++;//hash表中该字符串对应的数字次数加一
}
for(int i=0;i<m;i++){
scanf("%s",temp);
int id = hashFunc(temp,3);
printf("%d\n",hashTable[id]);
}
return 0;
}