字典树(Trie)是一个比较简单的数据结构,也叫前缀树,用来存储和查询字符串。例如,water
,wish
,win
,tie
,tired
这几个单词可以用以下方式存储:
其中每个字符占据一个节点,拥有相同前缀的字符串可以共用部分节点。起始点是特殊点(我们设为1号点),不存储字符。建树的代码如下:
const int MAXN = 500005;
int next[MAXN][26], cnt; // 用类似链式前向星的方式存图,next[i][c]表示i号点所连、存储字符为c+'a'的点的编号
void init() // 初始化
{
memset(next, 0, sizeof(next)); // 全部重置为0,表示当前点没有存储字符
cnt = 1;
}
void insert(const string &s) // 插入字符串
{
int cur = 1;
for (auto c : s)
{
// 尽可能重用之前的路径,如果做不到则新建节点
if (!next[cur][c - 'a'])
next[cur][c - 'a'] = ++cnt;
cur = next[cur][c - 'a']; // 继续向下
}
}
字典树可以方便地查询某个前缀是否存在:
bool find_prefix(const string &s) // 查找某个前缀是否出现过
{
int cur = 1;
for (auto c : s)
{
// 沿着前缀所决定的路径往下走,如果中途发现某个节点不存在,说明前缀不存在
if (!next[cur][c - 'a'])
return false;
cur = next[cur][c - 'a'];
}
return true;
}
如果是查询某个字符串是否存在,可以另开一个exist
数组,在插入完成时,把exist[叶子节点]
设置为true
,然后先按查询前缀的方法查询,在结尾处再判断一下exist
的值。 这是一种常见的套路,即用叶子节点代表整个字符串,保存某些信息。
字典树是一种空间换时间的数据结构,我们牺牲了字符串个数×字符串平均字符数×字符集大小的空间,但可以用 O(n) 的时间查询,其中 n 为查询的前缀或字符串的长度。
来看一道例题:
题目背景
XS中学化学竞赛组教练是一个酷爱炉石的人。
他会一边搓 炉石一边点名以至于有一天他连续点到了某个同学两次,然后正好被路过的校长发现了然后就是一顿 欧拉欧拉欧拉(详情请见已结束比赛 CON900)。
题目描述
这之后校长任命你为特派探员,每天记录他的点名。校长会提供化学竞赛学生的人数和名单,而你需要告诉校长他有没有点错名。(为什么不直接不让他玩炉石。)
输入格式
第一行一个整数 n ,表示班上人数。
接下来 n 行,每行一个字符串表示其名字(互不相同,且只含小写字母,长度不超过 5050)。
第 n+2 行一个整数 m ,表示教练报的名字个数。
接下来 m 行,每行一个字符串表示教练报的名字(只含小写字母,且长度不超过 50 )。
输出格式
对于每个教练报的名字,输出一行。
如果该名字正确且是第一次出现,输出OK
,如果该名字错误,输出WRONG
,如果该名字正确但不是第一次出现,输出REPEAT
。
说明/提示
对于 40% 的数据, n≤1000 , m≤2000 。
对于 70% 的数据, n≤104 , m≤2×104 。
对于 100% 的数据, n≤104 , m≤105 。
当然这个题其实用哈希表就可以轻松解决了,但也可以使用字典树。至于如何判断是否重复,只需要另开一个数组vis
,每次查询后把叶子节点的vis
设为true
即可。代码如下:
#include <bits/stdc++.h>
using namespace std;
const int MAXN = 500005;
namespace trie
{
int next[MAXN][26], cnt;
bool vis[MAXN], exist[MAXN];
void init()
{
memset(next, 0, sizeof(next));
cnt = 1;
}
void insert(const string &s)
{
int cur = 1;
for (auto c : s)
{
if (!next[cur][c - 'a'])
next[cur][c - 'a'] = ++cnt;
cur = next[cur][c - 'a'];
}
exist[cur] = true;
}
int find(const string &s)
{
int cur = 1, ans;
for (auto c : s)
{
if (!next[cur][c - 'a'])
return 0;
cur = next[cur][c - 'a'];
}
if (!exist[cur])
ans = 0;
else if (!vis[cur])
ans = 1;
else
ans = 2;
vis[cur] = true;
return ans;
}
} // namespace trie
int main()
{
int n;
cin >> n;
trie::init();
while (n--)
{
string s;
cin >> s;
trie::insert(s);
}
int q;
cin >> q;
while (q--)
{
string s;
cin >> s;
switch (trie::find(s))
{
case 0:
cout << "WRONG" << endl;
break;
case 1:
cout << "OK" << endl;
break;
case 2:
cout << "REPEAT" << endl;
}
}
return 0;
}