数据结构——哈希表

哈希表

哈希,又称散列,是把任意长度的输入通过哈希算法变换成固定长度的输出,该输出就是散列值。

哈希表是通过哈希函数把数据映射为数组下标(散列值),然后将数据存储在数组中对应下标的位置。当查询数据时,使用同样的哈希函数,将数据转化数组下标,从对应的数组下标的位置取数据。数据存储和查询的时间复杂度均为O(1)。

哈希算法

哈希算法的基本原理是将数据一个质数,从而计算出散列值。例如散列值的范围是10510^5105,那么该质数可以比10510^5105稍大,尽可能远离2n2^n2n,可以取100003。

冲突的解决方法

在进行模运算的过程中,可能存在不同数据的散列值相同的情况,此时会产生冲突。这里介绍两种解决冲突的做法,分别是拉链法和开放寻址法。先看模板问题。

模板问题

维护一个集合,支持如下几种操作:

I x,插入一个数 x;
Q x,询问数 x 是否在集合中出现过;

现在要进行 NNN 次操作,对于每个询问操作输出对应的结果。

输入格式

第一行包含整数 NNN,表示操作数量。

接下来 NNN 行,每行包含一个操作指令,操作指令为 I xQ x 中的一种。

输出格式

对于每个询问指令 Q x,输出一个询问结果,如果 xxx 在集合中出现过,则输出 Yes,否则输出 No
每个结果占一行。

数据范围

1≤N≤1051≤N≤10^51N105
−109≤x≤109−10^9≤x≤10^9109x109

输入样例

5
I 1
I 2
I 3
Q 2
Q 5

输出样例

Yes
No

代码实现一(拉链法)

拉链法,使用邻接表保存哈希值。对每个哈希值建立一个链表,将数据元素插入到其哈希值对应的链表中。访问时也要先计算出哈希值,然后遍历对应链表进行元素查找。

const int N = 100003; 
//拉链法,使用邻接表保存哈希值
int h[N], e[N], ne[N], idx; 
void insert(int x){
    //哈希得x所在链, x可能是一个负数,为了保证哈希后得到正数,所以需要+N
    int k = (x % N + N ) % N; 
    e[idx] = x; //找一个位置存放x
    //将新编号插入到k链的头部
    ne[idx] = h[k]; 
    h[k] = idx ++;
}
bool find(int x){
    int k = (x % N + N ) % N; 
    for(int i = h[k]; i != -1;i = ne[i]){
        if(e[i] == x) return true;
    }
    return false;
}
int main(){
    int n;
    scanf("%d", &n);
    //将链表初始化为-1,表示空结点
    memset(h, -1, sizeof(h)); 
    char op[2];
    int x;
    for(int i=1;i<=n;i++){
        scanf("%s%d", op, &x);
        if(op[0] == 'I') insert(x); //插入操作
        else{ //查询操作
            if(find(x)) puts("Yes");
            else puts("No");
        }
    }
    return 0;
}

代码实现二(开放寻址法)

使用一维数组存储要哈希的数值,在寻址的过程中如果产生冲突就看下一位置,直到找一个“空”位置。
注意:

  1. 哈希函数尽量使用是一个质数进行模运算,以减少冲突
  2. 开放寻址法,哈希表大小建议为数据规模2~3倍
#include <iostream>
#include <cstring>
using namespace std;
//null表示位置为空,注意null不应该在有效的数据范围内
const int N = 200003, null = 0x3f3f3f3f;

int h[N];

//找到x在哈希表中的位置
//如果x在哈希表中存在,则返回其位置
//否则,返回其应存储的位置
int find(int x)
{
    int k = (x % N + N) % N;
    //只要k位置不“空”,并且k位置不是x
    while(h[k] != null && h[k] != x)
    {
        k++;
        //注意:如果k超过了N的范围,将其置为0,从头开始找
        if(k == N) k = 0;
    }
    return k;
}

int main()
{
    int n;
    cin >> n;
    //将h[]数组初始化为“空”
    memset(h, 0x3f, sizeof h);
    while(n--)
    {
        char op[2];
        int x;
        scanf("%s%d", op, &x);
        int k = find(x);
        if(op[0] == 'I') h[k] = x;
        else
        {
            if(h[k] != null) puts("Yes");
            else puts("No");
        }
    }
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

少儿编程乔老师

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值