一般来说,散列可以浓缩成一句话“将元素通过一个函数转换为整数,使得该整数可以尽量唯一地代表这个元素”。
其中转换函数称为散列函数H,也就是说,如果元素在转换前为key,那么转换后就是一个整数H(key)。
常用的散列函数:直接定址法、平方取中法、除留余数法等。
解决冲突的三种方法:线性探查法(扎堆)、平方探查法、链地址法。
一般来说,可以使用标准库模板库中的map来直接使用hash的功能(C++ 11后可以使用unordered_map)。
字符串hash初步
//假设字母都是大写的,则对应到26进制中
int hashFunc(char S[], int len)
{
int id = 0;
for(int i = 0; i < len; i++)
id = id * 26 + (S[i] - 'A');
return id;
}
给出N个字符串(由3位大写字母组成),再给出M个查询字符串,问每个查询字符串在N个字符串中出现的次数。
#include <iostream>
#include <algorithm>
using namespace std;
const int maxn = 100;
char S[maxn][5], temp[5];
int hashTable[26 * 26 * 26 + 10] = {0};
int hashFunc(char S[], int len)
{
int id = 0;
for(int i = 0; i < len; i++)
id = id * 26 + (S[i] - 'A');
return id;
}
int main()
{
int n, m;
cin >> n >> m;
for(int i = 0; i < n; i++)
{
cin >> S[i];
int id = hashFunc(S[i], 3);
hashTable[id]++;
}
for(int i = 0; i < m; i++)
{
cin >> temp;
int id = hashFunc(temp, 3);
cout << hashTable[id] << endl;
}
return 0;
}
本文介绍了散列函数的基本概念,包括如何将元素转换为整数以唯一标识,以及常用的散列函数如直接定址法、平方取中法、除留余数法。此外,还探讨了解决散列冲突的三种方法:线性探查法、平方探查法和链地址法,并提供了使用散列函数进行字符串匹配的实例代码。
795

被折叠的 条评论
为什么被折叠?



