字典树在多个单词匹配长句或者求单词的相似前缀时非常好用。
下面是他的结构:
字典树的每一条边就是一个字母,按照单词字母顺序给节点排序号。
这里用二维数组代表线段树的结构:\(tree[i][j]=k\)
\(i\)代表节点序号,\(j\)代表是上一个节点下面的哪个字母节点(\(a-z\)分为\(0-25\)),\(k\)代表下一个节点的序号。
如果要查找单词还需要一个is_end数组来记录保存哪些节点是末节点。
下面是字典树的插入节点函数:
void insert(string s,int node)//node从0开始
{
for (int i = 0; s[i]; i++)
{
int num = s[i] - 'a';
if (trie[node][num] == 0)
trie[node][num] = ++tot;//全部变量,让序号一直增长
node = trie[node][num];//获取下一个点的序号
}
//is_end[node] = 1;//如果到了终点给下一个节点赋结束符
}
查找函数:
bool find(string s,int node)//找前缀或者找单词
{
for (int i = 0; s[i] ; i++)
{
int num = s[i] - 'a';
if (trie[node][num] == 0)
return 0;
node = trie[node][num];
}
//if (is_end(node))//查找单词的时候使用,判断是否是末节点就可以了
return 1;
//else
//return 0;
}
附上一道字典树的题和代码:P2580 于是他错误的点名开始了
#include<bits/stdc++.h>
using namespace std;
const int MAXN = 300000 + 10;
int tree[MAXN][26];
int is_end[MAXN];
int tot;
void insert(string s)
{
int node = 0;
for (int i = 0; s[i]; i++)
{
int t = s[i] - 'a';
if (tree[node][t] == 0)
tree[node][t] = ++tot;
node = tree[node][t];
}
is_end[node] = 1;
}
int find(string s)
{
int node = 0;
for (int i = 0; s[i]; i++)
{
int num = s[i] - 'a';
if (tree[node][num] == 0)
return 0;
node = tree[node][num];
}
if (is_end[node] == 1)
{
is_end[node] = 2;
return 1;
}
else if (is_end[node] == 2)
return 2;
return 0;
}
int main()
{
int m;
cin >> m;
while (m--)
{
string name;
cin >> name;
insert(name);
}
cin >> m;
while (m--)
{
string name;
cin >> name;
int n = find(name);
if (n == 0)
cout << "WRONG" << endl;
else if (n == 1)
cout << "OK" << endl;
else
cout << "REPEAT" << endl;
}
return 0;
}