哈希表
哈希,又称散列,是把任意长度的输入通过哈希算法变换成固定长度的输出,该输出就是散列值。
哈希表是通过哈希函数把数据映射为数组下标(散列值),然后将数据存储在数组中对应下标的位置。当查询数据时,使用同样的哈希函数,将数据转化数组下标,从对应的数组下标的位置取数据。数据存储和查询的时间复杂度均为O(1)。
哈希算法
哈希算法的基本原理是将数据模一个质数,从而计算出散列值。例如散列值的范围是10510^5105,那么该质数可以比10510^5105稍大,尽可能远离2n2^n2n,可以取100003。
冲突的解决方法
在进行模运算的过程中,可能存在不同数据的散列值相同的情况,此时会产生冲突。这里介绍两种解决冲突的做法,分别是拉链法和开放寻址法。先看模板问题。
模板问题
维护一个集合,支持如下几种操作:
I x
,插入一个数 x;
Q x
,询问数 x 是否在集合中出现过;
现在要进行 NNN 次操作,对于每个询问操作输出对应的结果。
输入格式
第一行包含整数 NNN,表示操作数量。
接下来 NNN 行,每行包含一个操作指令,操作指令为 I x
,Q x
中的一种。
输出格式
对于每个询问指令 Q x
,输出一个询问结果,如果 xxx 在集合中出现过,则输出 Yes
,否则输出 No
。
每个结果占一行。
数据范围
1≤N≤1051≤N≤10^51≤N≤105
−109≤x≤109−10^9≤x≤10^9−109≤x≤109
输入样例
5
I 1
I 2
I 3
Q 2
Q 5
输出样例
Yes
No
代码实现一(拉链法)
拉链法,使用邻接表保存哈希值。对每个哈希值建立一个链表,将数据元素插入到其哈希值对应的链表中。访问时也要先计算出哈希值,然后遍历对应链表进行元素查找。
const int N = 100003;
//拉链法,使用邻接表保存哈希值
int h[N], e[N], ne[N], idx;
void insert(int x){
//哈希得x所在链, x可能是一个负数,为了保证哈希后得到正数,所以需要+N
int k = (x % N + N ) % N;
e[idx] = x; //找一个位置存放x
//将新编号插入到k链的头部
ne[idx] = h[k];
h[k] = idx ++;
}
bool find(int x){
int k = (x % N + N ) % N;
for(int i = h[k]; i != -1;i = ne[i]){
if(e[i] == x) return true;
}
return false;
}
int main(){
int n;
scanf("%d", &n);
//将链表初始化为-1,表示空结点
memset(h, -1, sizeof(h));
char op[2];
int x;
for(int i=1;i<=n;i++){
scanf("%s%d", op, &x);
if(op[0] == 'I') insert(x); //插入操作
else{ //查询操作
if(find(x)) puts("Yes");
else puts("No");
}
}
return 0;
}
代码实现二(开放寻址法)
使用一维数组存储要哈希的数值,在寻址的过程中如果产生冲突就看下一位置,直到找一个“空”位置。
注意:
- 哈希函数尽量使用是一个质数进行模运算,以减少冲突
- 开放寻址法,哈希表大小建议为数据规模2~3倍
#include <iostream>
#include <cstring>
using namespace std;
//null表示位置为空,注意null不应该在有效的数据范围内
const int N = 200003, null = 0x3f3f3f3f;
int h[N];
//找到x在哈希表中的位置
//如果x在哈希表中存在,则返回其位置
//否则,返回其应存储的位置
int find(int x)
{
int k = (x % N + N) % N;
//只要k位置不“空”,并且k位置不是x
while(h[k] != null && h[k] != x)
{
k++;
//注意:如果k超过了N的范围,将其置为0,从头开始找
if(k == N) k = 0;
}
return k;
}
int main()
{
int n;
cin >> n;
//将h[]数组初始化为“空”
memset(h, 0x3f, sizeof h);
while(n--)
{
char op[2];
int x;
scanf("%s%d", op, &x);
int k = find(x);
if(op[0] == 'I') h[k] = x;
else
{
if(h[k] != null) puts("Yes");
else puts("No");
}
}
return 0;
}