Trie
一、引入
所有的书上的都是官方话,字典树其实是干嘛的?就好比字典是干啥的,是用来查汉字的(打人用的 )那么字典树就是用来查单词的,也就是用来查询字符串的
我这里要抱怨一下,洛谷没有模板题
我们先看一道题:
给定n个单词m个询问,每次询问一个前缀,问答这个询问是对少单词的询问
答:map!把每个单词拆开
结果肯定就是超时了
这就需要一种高级数据结构了——Trie
原理
这就是Trie的画法
这里可以看出:
1.Trie用边表示字母
2.根节点是空的,因为便于插入查找
3.每一个单词结束之后我们都得有一个标记
那么我们明白原理了,我们再来看看操纵
插入
如果需要插入一个字符串s时,我们用一个指针p起始指向根节点,然后以此扫描s中的字符c
1.如果p的c字符指针指向一个已经从存在的节点q,那么让p=q
2.如果p的c字符指针指着空,就新建一个节点q,让p的c字符指针指向q,p=q
如果最后扫描完了,再当前节点标记一个结尾符号
1.的原理其实就是还有存在这个节点,接着往下找
2.的原理其实就是第一次遇见
查询
当需要查询一个字符串s再Trie中是否存在时,我们让一个指针p指向根节点,然后以此扫描s中的c
1.如果p的c字符指针指着空,说明s没有被插入过Trie,结束
2.如果p的c字符指向一个已经存在的点q,那么让p=q
当s中的字符扫描完后,若p被标记过结束标记,说明存在,否则说在Trie中未出现过
这种算法很高级,把字符串插入到树里面,首字母在边上,点就是用来标记
trie的查询和插入都是O(n)复杂度
我们来瞅瞅代码
int trie[size][26],tot=1;//tot存编号,1号为根节点
void insert(char *str)
{
int l=strlen(str),p=1;
for(int k=0;k<len;k++)//枚举每一位
{
int c=str[k]-'a';//转int
if(trie[p][c]==0) trie[p][c]=++tot;//新建节点
p=trie[p][c];
}
end[p]=true;//结束标记
}
void findd(char *str)
{//查询
int len=strlen(str),p=1;
for(int k=0;k<len;k++)
{
p=trie[p][str[k]-'a'];//获取每一位的位置
if(!p) return false;//不存在
}
return end[p];//返回位置
}
Trie树还可以来解决很多非字符串问题,比如可以用Trie代替平衡树
另外,在Trie上,两个字符串的最长公共前缀(LCP)就是两个点LCA所对应的点