散列

最新推荐文章于 2024-06-27 20:01:52 发布

穆穆不惊左右

最新推荐文章于 2024-06-27 20:01:52 发布

阅读量180

点赞数

CC 4.0 BY-SA版权

分类专栏： PAT

本文链接：https://blog.youkuaiyun.com/pihe7623/article/details/79692919

PAT 专栏收录该内容

72 篇文章

订阅专栏

1.散列的定义及整数散列

给出N个正整数，再给出M个正整数。问这M个数中的每个数分别是否在N中出现过。(M,N不超过10的5次方）

思路：

设定一个bool型数组 hashTable[100010]，hashTable[x]==true说明正整数x在N中出现过。一开始读入的时候就进行赋值为true（hashTable初始化为false）。时间复杂度O（N+M）

若要输出每个数出现的次数。把hashTable换成int型，输入为x时hashTable[x]++;

空间换时间：

直接把输入的数作为数组的下标来对这个数的性质进行统计。

2.字符串hash初步

将一个字符串映射为一个整数，使得该整数可以尽可能唯一地代表该字符串

1.字符串均由大写字母A~Z构成，把A~Z视为0~25，对应到了二十六进制。

int hashFunc(char s[],int len){
	int id = 0;
	for(int i=0;i<len;i++){
		id = id*26 + (s[i]-'A');
	}
	return id;
}//转换成的最大整数是26的len次方-1

字符串很长的话转换成的整数会很大

2.如果有小写字母，A~Z为0~25，a~z为26~51；五十二进制转换为十进制的问题。

for(int i=0;i<len;i++){
	if(s[i]>='A'&&s[i]<='Z'){
		id = id*52+(s[i]-'A');
	}else if(s[i]>='a'&&s[i]<='z'){
		id = id*52+(s[i]-'a')+26;
	}
}

3.出现数字的解决办法

第一种：增大进制数至62。

第二种：如果保证在字符串的末尾是确定个数的数字，前面英文字母部分还是按上面的思路转换为整数，再将末尾的数字直接拼上去。

eg：BCD转换为整数731。BCD4就是7314。

int hashFunc(char S[],int len){
	int id=0;
	for(int i=0;i<len-1;i++){
		id=id*26+(S[i]-'A');
	}
	id = id*10 + (S[len-1]-'0');
	return id;
}

eg：N个字符串（三个大写字母组成），再给出M个查询字符串。问每个查询字符串在N个字符串中出现的次数。

#include <cstdio>

const int maxn = 100;
char S[maxn][5],temp[5];
int hashTable[26*26*26+10];
int hashFunc(char S[],int len){
	int id=0;
	for(int i=0;i<len;i++){
		id = id*26+(S[i]-'A');
	}
	return id;
}

int main(){
	int n,m;
	scanf("%d%d",&n,&m);
	for(int i=0;i<n;i++){
		scanf("%s",S[i]);
		int id = hashFunc(S[i],3);//3是因为三个大写字母 
		hashTable[id]++;//hash表中该字符串对应的数字次数加一 
	}

for(int i=0;i<m;i++){
	scanf("%s",temp);
	int id = hashFunc(temp,3);
	printf("%d\n",hashTable[id]);
}	
return 0;
}