简介
模拟散列表是哈希算法的一种实现方式,有开放寻址法和拉链法两种方式,本次主要讲解开发寻址法,拉链法后续补充。
算法思想
开放寻址法采用hash函数找到在hash数组中对应的位置,如果该位置上有值,并且这个值不是寻址的值,则出现冲突碰撞,需要解决冲突方案,该算法采用简单的向右继续寻址来解决问题。
例如:
在语言模型中,编码器和解码器都是由一个个的 Transformer 组件拼接在一起形成的。
具体分析
让人费解的参数
const int N = 200003;
1.1开放寻址操作过程中会出现冲突的情况,一般会开成两倍的空间,减少数据的冲突
1.2如果使用%来计算索引, 把哈希表的长度设计为素数(质数)可以大大减小哈希冲突(将使用数组长度进行哈希,数组长度为质数)
比如
10%8 = 2 10%7 = 3
20%8 = 4 20%7 = 6
30%8 = 6 30%7 = 2
40%8 = 0 40%7 = 5
50%8 = 2 50%7 = 1
60%8 = 4 60%7 = 4
70%8 = 6 70%7 = 0
这就是为什么要找第一个比空间大的质数
实战题目
代码(C++版本)
//开放寻址法
/*
个人感觉开放寻址法就是在一个巨大的容器里面进行存放地址,
通常会把整个数组里面的元素值赋值为数据范围以外的数据,且数组的长度是限定的2~3倍
*/
#include<iostream>
#include<cstring>
using namespace std;
const long long int N=