一、哈希表是什么
拉链法:
开放寻址法:
---------------------------------------------------------------------------------------------------------------------------------
二、
840. 模拟散列表
维护一个集合,支持如下几种操作:
I x
,插入一个数 xx;Q x
,询问数 xx 是否在集合中出现过;
现在要进行 NN 次操作,对于每个询问操作输出对应的结果。
输入格式
第一行包含整数 NN,表示操作数量。
接下来 NN 行,每行包含一个操作指令,操作指令为 I x
,Q x
中的一种。
输出格式
对于每个询问指令 Q x
,输出一个询问结果,如果 xx 在集合中出现过,则输出 Yes
,否则输出 No
。
每个结果占一行。
数据范围
1≤N≤1051≤N≤105
−109≤x≤109−109≤x≤109
输入样例:
5
I 1
I 2
I 3
Q 2
Q 5
输出样例:
Yes
No
拉链法:e数组用来存放数值,ne数组存放的是指向h[k]链表的指针;h数组存放的是整个N这个长条序列串。
#include<iostream>
#include<cstring>
using namespace std;
#define N 100003
int h[N],e[N],ne[N],idx;
void Insert(int x)
{
int k=(x%N+N)%N;
e[idx]=x;
ne[idx]=h[k];
h[k]=idx++;
}
bool find(int x)
{
int k=(x%N+N)%N;
for(int i=h[k];i!=-1;i=ne[i])
if(e[i]==x)return true;
return false;
}
int main()
{
int n;
cin>>n;
memset(h, -1, sizeof h);
while(n--)
{
char a;
int b;
cin>>a>>b;
if(a=='I')Insert(b);
else
{
if(find(b))cout<<"Yes"<<endl;
else cout<<"No"<<endl;
}
}
return 0;
}
开放寻址法:记得将数组长度开到2到3倍;为什么memset(h, 0x3f, sizeof h);?而不是0x3f3f3f?
一个h有4个字节,sizeof h指的是1个字节,指每一个字节都是0x3f,已经是0x3f3f3f3f。
#include<iostream>
#include<cstring>
using namespace std;
#define N 200003
const int null = 0x3f3f3f3f;
int h[N];
int find(int x)
{
int k=(x%N+N)%N;
while(h[k]!=null&&h[k]!=x)
{
k++;
if(k==N)k=0;
}
return k;
}
int main()
{
int n;
cin>>n;
memset(h, 0x3f, sizeof h);
while(n--)
{
char a;
int b;
cin>>a>>b;
if(a=='I')
{
int k=find(b);
h[k]=b;
}
else
{
int k=find(b);
if(h[k]!=null)cout<<"Yes"<<endl;
else cout<<"No"<<endl;
}
}
return 0;
}
---------------------------------------------------------------------------------------------------------------------------------
三、哈希表字符串
1.先将前i个字符串全部换成哈希值h数组存放的是前i个字符的哈希值
2.图中有错误,应该是h[r]-h[l-1]*p^r-l+1,该式子可以求出从l到r的字符串哈希值
图中的p可以使用数组来处理p[N],p[0]=1,指P的0次方是1;
---------------------------------------------------------------------------------------------------------------------------------
四、
841. 字符串哈希
给定一个长度为 nn 的字符串,再给定 mm 个询问,每个询问包含四个整数 l1,r1,l2,r2l1,r1,l2,r2,请你判断 [l1,r1][l1,r1] 和 [l2,r2][l2,r2] 这两个区间所包含的字符串子串是否完全相同。
字符串中只包含大小写英文字母和数字。
输入格式
第一行包含整数 nn 和 mm,表示字符串长度和询问次数。
第二行包含一个长度为 nn 的字符串,字符串中只包含大小写英文字母和数字。
接下来 mm 行,每行包含四个整数 l1,r1,l2,r2l1,r1,l2,r2,表示一次询问所涉及的两个区间。
注意,字符串的位置从 11 开始编号。
输出格式
对于每个询问输出一个结果,如果两个字符串子串完全相同则输出 Yes
,否则输出 No
。
每个结果占一行。
数据范围
1≤n,m≤1051≤n,m≤105
输入样例:
8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes
思路在上图。
#include<iostream>
using namespace std;
typedef unsigned long long ULL;
#define N 100010
const int P=131;
char str[N];
ULL h[N],p[N];
int exmine(int x,int y)
{
return h[y]-h[x-1]*p[y-x+1];
}
int main()
{
int n,m;
scanf("%d%d%s",&n,&m,str+1);
p[0]=1;
for(int i=1;i<=n;i++)
{
p[i]=p[i-1]*P;
h[i]=h[i-1]*P+str[i];
}
while(m--)
{
int l1,r1,l2,r2;
cin>>l1>>r1>>l2>>r2;
if(exmine(l1,r1)==exmine(l2,r2))cout<<"Yes"<<endl;
else cout<<"No"<<endl;
}
}
为什么P取131或者13331?可以使遇到的冲突最少。
---------------------------------------------------------------------------------------------------------------------------------
五、
vector
倍增思想:申请n个空间时,从1个空间申请,第二次申请2个,第三次申请2^2个,直到申请的空间数等于或大于为止。
还支持比较运算,按字典序比较
pair
定义:
string
substr(1,5)某str返回1到5的字串
c_str返回整个串
queue
没有clear函数
使用以下清空:
priority_queue
如果建造小根堆,直接插入-x即可,先取出来的一定是最小的。
或者用以下方法:
stack
deque
set map multiset multimap
map的映射功能
bitset