什么时字典树
又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。
基本操作
查找、插入、删除(此段代码没有实现删除)
实现
在每一个节点上不保存信息,把信息保存在边(路径)上。
如上图所示将字符串的状态表示在节点之间的连接线上。
插入:
遍历需要插入的字符串,从树的根节点开始查找,是否存在当前边,如果不存在则新建一条边,然后指向下一个节点。如果存在直接指向下一个个节点。
查找:
-
查找一个字符串是否存在
查找一个字符串是否存在需要在节点上封装一个状态,表示是否有字符串已当前节点结尾。
原因,假如我们向树中插入一个字符串“abcdefg”,然后查找是否有“abc”的字符串,也会查找出来。
扩展:
-
查找是否有字符串已这个字符串开头
查找是否有字符串已这个字符串开头,只需看在这个树中能否将这个字符串走完
删除:
删除只需要将每条链上的状态取消掉就行。
public class Trie {
class TrieNode{
TrieNode[] next; // 可以用 hash 实现跟复杂的状态
int end;
public TrieNode() {
next = new TrieNode[26];
end = 0;
}
}
TrieNode root;
public Trie() {
root = new TrieNode();
}
public void insert(String word) { // 插入
int n = word.length();
TrieNode p = root;
for(int i = 0; i < n; i++){
int ind = word.charAt(i) - 'a';
if(p.next[ind] == null) p.next[ind] = new TrieNode(); // 如果不存在则新建一条边
p = p.next[ind]; // 指向下一个节点
}
p.end++;
}
public boolean search(String word) { // 查找
int n = word.length();
TrieNode p = root;
for(int i = 0; i < n; i++){
int ind = word.charAt(i) - 'a';
if(p.next[ind] == null) return false;
p = p.next[ind];
}
return p.end > 0;
}
}