有关trie树的概念
在进行文法分析的时候,通常需要检测一个单词是否在我们的单词列表里。为了提高查找和定位的速度,通常都要画出与单词列表所对应的单词查找树,其特点如下:
根节点不包含字母,除根节点外每一个节点都仅包含一个大写英文字母;
从根节点到某一节点,路径上经过的字母依次连起来所构成的字母序列,称为该节点对应的单词。单词列表中的每个词,都是该单词查找树某个节点所对应的单词;
在满足上述条件下,该单词查找树的节点数最少。
字典树的结构就是这样的。
trie树的建树
实现很简单,规定根节点的编号是1,则从根节点开始遍历,如果不能遍历则新建一个节点,否则继续往下遍历。并在单词结尾的地方表上标记,表示此处有一个单词。
代码如下:
void insert(char* s)
{
int len=strlen(s),p=1;
for (int i=0;i<len;++i)
{
int val=s[i]-'a';
if (trie[p][val]==0) trie[p][val]=++cnt;
p=trie[p][val];
}
end[p]++;
}
trie树的遍历
trie数的遍历方式同建立方式一样,不断查找;如果找不到了,那就返回false;否则继续找。
void ask(char* s)
{
int len=strlen(s),p=1;
for (int i=0;i<len;++i)
{
int val=s[i]-'a';
if (trie[p][val]==0) break;
p=trie[p][val];
}
}
Trie树例题:前缀统计
给定N个字符串S1,S2…SN,接下来进行M次询问,每次询问给定一个字符串T,求S1~SN中有多少个字符串是T的前缀。输入字符串的总长度不超过10^6,仅包含小写字母。
这就是一道trie树模板的变式,只要在建树的时候在结尾处累加答案,然后在查找的时候对于经过的每一个节点都把对应的答案累加即可。
#include <bits/stdc++.h>
using namespace std;
const int N=1e6+5;
int n,m,cnt=1;
char s[N];
int trie[N][30],end[N];
void insert(char* s)
{
int len=strlen(s),p=1;
for (int i=0;i<len;++i)
{
int val=s[i]-'a';
if (trie[p][val]==0) trie[p][val]=++cnt;
p=trie[p][val];
}
end[p]++;
}
void ask(char* s)
{
int len=strlen(s),p=1,ans=0;
for (int i=0;i<len;++i)
{
int val=s[i]-'a';
if (trie[p][val]==0) break;
p=trie[p][val];
ans+=end[p];
}
printf("%d\n",ans);
}
int main(void)
{
freopen("test.in","r",stdin);
freopen("test.out","w",stdout);
scanf("%d %d",&n,&m);
for (int i=1;i<=n;++i)
{
scanf("%s",s);
insert(s);
}
for (int i=1;i<=m;++i)
{
scanf("%s",&s);
ask(s);
}
return 0;
}
Trie树例题2:The XOR Largest Pair
在给定的N个整数A1,A2……AN中选出两个进行xor运算,得到的结果最大是多少?
我们知道,每一个数都有一个对应的二进制数,我们把每一个数转换为一个32位的二进制数,并以高位作为起始点建立一个trie树。
由于需要异或最大,因为对于每一个要查找的数,先尽量从高位反着走,如果反着走不通再尝试正着走;如果正着再走不通那就直接退出即可。
代码如下:
#include <bits/stdc++.h>
using namespace std;
int n,m,ans,cnt;
int a[50];
int s[50];
int trie[100000*27][27];
void find(void)
{
int p=1,sum=0;
for (int i=32;i;--i)
{
int v=a[i];
if (trie[p][v^1]) p=trie[p][v^1],sum+=s[i];
else if (trie[p][v]) p=trie[p][v];
else break;
}
ans=max(ans,sum);
}
void insert(void)
{
int p=1;
for (int i=32;i;--i)
{
int v=a[i];
if (trie[p][v]==0) trie[p][v]=++cnt;
p=trie[p][v];
}
}
int main(void)
{
freopen("test.in","r",stdin);
freopen("test.out","w",stdout);
scanf("%d",&n);
ans=0;
cnt=1;
s[1]=1;
for (int i=2;i<=32;++i) s[i]=s[i-1]*2;
for (int i=1,k;i<=n;++i)
{
m=0;
scanf("%d",&k);
for (int i=1;i<=32;++i) a[i]=0;
while (k)
{
a[++m]=k&1;
k>>=1;
}
find();
insert();
}
printf("%d\n",ans);
return 0;
}