Trie:高效地存储和查找字符串集合的数据结构
例题:
Trie字符串统计
维护一个字符串集合,支持两种操作:
I x
向集合中插入一个字符串 x;Q x
询问一个字符串在集合中出现了多少次。
共有 N 个操作,输入的字符串总长度不超过 105,字符串仅包含小写英文字母。
输入格式
第一行包含整数 N,表示操作数。
接下来 N 行,每行包含一个操作指令,指令为 I x
或 Q x
中的一种。
输出格式
对于每个询问指令 Q x
,都要输出一个整数作为结果,表示 xx 在集合中出现的次数。
每个结果占一行。
数据范围
1≤N≤2∗104
输入样例:
5
I abc
Q abc
Q ab
I ab
Q ab
输出样例:
1
0
1
解题代码:
#include <iostream>
using namespace std;
const int N =100010;
int son[N][26],cnt[N],idx;//26表示每个节点可以外面连26个边,cnt表示以当前这个点结尾的单词有多少个,idx当前用到的哪个下标
//下标是0的点,既是根节点有,又是空节点
char str[N];
//插入操作
void insert(char str[])
{
//从根节点开始,从前往后遍历字符串
int p = 0;
for(int i = 0;str[i]; i++)
{
//找到当前节点对应的子节点编号,把a-z映射成0-25
int u = str[i] - 'a';
//如果不存在,就创建
if(!son[p][u]) son[p][u] = ++ idx;
p= son[p][u];
}
//以这个为节点的单词数加1
cnt[p] ++;
}
//查询操作
int query(char str[])
{
int p = 0;
for(int i = 0;str[i];i++)
{
int u = str[i] - 'a';
if(!son[p][u]) return 0;//不存在子节点
p= son[p][u];//走过去
}
return cnt[p];
}
int main()
{
int n;
scanf("%d", &n);
while (n --)//n个操作
{
char op[2];
scanf("%s%s",op,str);//读入操作类型,读入字符串
if(op[0] == 'I') insert(str);
else printf("%d\n",query(str));
}
return 0;
}
并查集
优化:路径压缩
例题:
合并集合
一共有 n 个数,编号是 1∼n,最开始每个数各自在一个集合中。
现在要进行 m 个操作,操作共有两种:
M a b
,将编号为 aa 和 bb 的两个数所在的集合合并,如果两个数已经在同一个集合中,则忽略这个操作;Q a b
,询问编号为 aa 和 bb 的两个数是否在同一个集合中;
输入格式
第一行输入整数 n 和 m。
接下来 m 行,每行包含一个操作指令,指令为 M a b
或 Q a b
中的一种。
输出格式
对于每个询问指令 Q a b
,都要输出一个结果,如果 a 和 b 在同一集合内,则输出 Yes
,否则输出 No
。
每个结果占一行。
数据范围
1≤n,m≤105
输入样例:
4 5
M 1 2
M 3 4
Q 1 2
Q 1 3
Q 3 4
输出样例:
Yes
No
Yes
解题代码:
#include <iostream>
using namespace std;
const int N = 100010;
int n,m;
int p[N];
int find(int x)//返回x的祖宗节点+路径压缩
{
if (p[x] != x) p[x] = find(p[x]);//没找到根节点就一直找
return p[x];//返回父节点
}
int main()
{
scanf("%d%d",&n,&m);
for(int i=1;i <= n;i ++) p[i] = i;//先把所有的父节点变成自己
while(m --)
{
char op[2];
int a,b;
scanf("%s%d%d",op,&a,&b);
if(op[0] == 'M') p[find(a)] = find(b);//a的节点的父亲是b节点
else
{
if(find(a) == find(b)) puts("Yes");
else puts("No");
}
}
return 0;
}
例题:
连通块中点的数量
给定一个包含 n 个点(编号为 1∼n)的无向图,初始时图中没有边。
现在要进行 m 个操作,操作共有三种:
C a b
,在点 a 和点 b 之间连一条边,a 和 b 可能相等;Q1 a b
,询问点 a 和点 b 是否在同一个连通块中,a 和 b 可能相等;Q2 a
,询问点 a 所在连通块中点的数量;
输入格式
第一行输入整数 n 和 m。
接下来 m 行,每行包含一个操作指令,指令为 C a b
,Q1 a b
或 Q2 a
中的一种。
输出格式
对于每个询问指令 Q1 a b
,如果 a 和 b 在同一个连通块中,则输出 Yes
,否则输出 No
。
对于每个询问指令 Q2 a
,输出一个整数表示点 a 所在连通块中点的数量
每个结果占一行。
数据范围
1≤n,m≤105
输入样例:
5 5
C 1 2
Q1 1 2
Q2 1
C 2 5
Q2 5
输出样例:
Yes
2
3
解题代码:
#include <iostream>
using namespace std;
const int N = 100010;
int n, m;
int p[N], cnt[N];
int find(int x)//返回x的祖宗节点+路径压缩
{
if (p[x] != x) p[x] = find(p[x]);//没找到根节点就一直找
return p[x];//返回父节点
}
int main()
{
cin >> n >> m;
for (int i = 1; i <= n; i ++ )
{
p[i] = i;//先把所有的父节点变成自己
cnt[i] = 1;
}
while (m -- )
{
string op;
int a, b;
cin >> op;
if (op == "C")
{
cin >> a >> b;
a = find(a), b = find(b);
if (a != b)
{
p[a] = b;//a的节点的父亲是b节点
cnt[b] += cnt[a];//最开始每个块只有一个节点
}
}
else if (op == "Q1")
{
cin >> a >> b;
if (find(a) == find(b)) puts("Yes");
else puts("No");
}
else //询问某个点所在集合的数量
{
cin >> a;
cout << cnt[find(a)] << endl;
}
}
return 0;
}
堆
例题:
堆排序
输入一个长度为 nn 的整数数列,从小到大输出前 m 小的数。
输入格式
第一行包含整数 n 和 m。
第二行包含 n 个整数,表示整数数列。
输出格式
共一行,包含 m 个整数,表示整数数列中前 m 小的数。
数据范围
1≤m≤n≤105
1≤数列中元素≤109
输入样例:
5 3
4 5 1 3 2
输出样例:
1 2 3
解题代码:
#include <iostream>
#include <algorithm>
using namespace std;
const int N = 100010;
int n, m;
int h[N], cnt;
void down(int u)
{
int t = u;
if (u * 2 <= cnt && h[u * 2] < h[t]) t = u * 2;
if (u * 2 + 1 <= cnt && h[u * 2 + 1] < h[t]) t = u * 2 + 1;
if (u != t)
{
swap(h[u], h[t]);
down(t);
}
}
int main()
{
scanf("%d%d", &n, &m);
for (int i = 1; i <= n; i ++ ) scanf("%d", &h[i]);
cnt = n;
for (int i = n / 2; i; i -- ) down(i);
while (m -- )
{
printf("%d ", h[1]);
h[1] = h[cnt -- ];
down(1);
}
puts("");
return 0;
}
模拟堆
维护一个集合,初始时集合为空,支持如下几种操作:
I x
,插入一个数 x;PM
,输出当前集合中的最小值;DM
,删除当前集合中的最小值(数据保证此时的最小值唯一);D k
,删除第 k 个插入的数;C k x
,修改第 k 个插入的数,将其变为 x;
现在要进行 N 次操作,对于所有第 2 个操作,输出当前集合的最小值。
输入格式
第一行包含整数 N。
接下来 N 行,每行包含一个操作指令,操作指令为 I x
,PM
,DM
,D k
或 C k x
中的一种。
输出格式
对于每个输出指令 PM
,输出一个结果,表示当前集合中的最小值。
每个结果占一行。
数据范围
1≤N≤105
−109≤x≤109
数据保证合法。
输入样例:
8
I -10
PM
I -10
D 1
C 2 8
I 6
PM
DM
输出样例:
-10
6
解题代码:
#include <iostream>
#include <algorithm>
#include <string.h>
using namespace std;
const int N = 100010;
int h[N], ph[N], hp[N], cnt;//ph[k]:第k个要插入点是哪个点,堆的下标是什么
//hp[k]:堆里的某个点是要插入的第几个点
void heap_swap(int a, int b)
{
swap(ph[hp[a]],ph[hp[b]]);
swap(hp[a], hp[b]);
swap(h[a], h[b]);
}
void down(int u)
{
int t = u;
if (u * 2 <= cnt && h[u * 2] < h[t]) t = u * 2;
if (u * 2 + 1 <= cnt && h[u * 2 + 1] < h[t]) t = u * 2 + 1;
if (u != t)
{
heap_swap(u, t);
down(t);
}
}
void up(int u)
{
while (u / 2 && h[u] < h[u / 2])
{
heap_swap(u, u / 2);
u >>= 1;
}
}
int main()
{
int n, m = 0;
scanf("%d", &n);
while (n -- )
{
char op[5];
int k, x;
scanf("%s", op);
if (!strcmp(op, "I"))//插入一个数
{
scanf("%d", &x);
cnt ++ ;//堆里多个元素
m ++ ;//当前第几个插入的数
ph[m] = cnt, hp[cnt] = m;
h[cnt] = x;
up(cnt);
}
else if (!strcmp(op, "PM")) printf("%d\n", h[1]);//输出最小值
else if (!strcmp(op, "DM"))//删除最小值
{
heap_swap(1, cnt);
cnt -- ;
down(1);
}
else if (!strcmp(op, "D"))//删除第k个插入的数
{
scanf("%d", &k);//读入第k个数
k = ph[k];//找到k在堆里面的位置
heap_swap(k, cnt);
cnt -- ;
//下面两个操作,最多执行一个
up(k);
down(k);
}
else //将第k个插入的数修改
{
scanf("%d%d", &k, &x);
k = ph[k];//找到k在堆里面的位置
h[k] = x;//直接修改
up(k);
down(k);
}
}
return 0;
}