一文搞懂字典树

定义

前缀树,又称字典树、单词查找树、 T r i e Trie Trie树(发音类似 try)。它是一棵 N N N 叉树。前缀树的每一个结点代表一个字符串的前缀。每一个结点会有多个子结点,
通往不同子结点的路径上有着不同的字符。子结点代表的字符串是由结点本身的原始字符串,以及通往该子结点上所有的字符组成的。

前缀树的一个重要的特性是,结点所有的后代都与该结点相关的字符串有着共同的前缀,这是前缀树名称的由来。

例如,以结点 "b" 为根的子树中的结点表示的字符串,都具有共同的前缀 "b"。反之亦然,具有公共前缀 "b" 的字符串,全部位于以 "b" 为根的子树中,并且具有不同前缀的字符串来自不同的分支。

前缀树有着广泛的应用,例如自动补全,拼写检查等等。

在这里插入图片描述

实现 T r i e Trie Trie

208. 实现 Trie (前缀树)

T r i e Trie Trie,是一棵有根树,其每个结点包含以下字段:

  • 指向子结点的指针数组 c h i l d r e n children children。对于本题而言,数组长度为 26,即小写字母的数量。此时 c h i l d r e n [ 0 ] children[0] children[0] 对应小写字母 a a a c h i l d r e n [ 1 ] children[1] children[1] 对应小写字母 b b b,…, c h i l d r e n [ 25 ] children[25] children[25] 对应小写字母 z z z
  • 布尔字段 i s E n d isEnd isEnd,表示该结点是否为字符串的结尾。

插入字符串

我们从字典树的根开始,插入字符串。对于当前字符对应的子结点,有两种情况:

  • 子结点存在。沿着指针移动到子结点,继续处理下一个字符。
  • 子结点不存在。创建一个新的子结点,记录在 c h i l d r e n children children 数组的对应位置上,然后沿着指针移动到子结点,继续搜索下一个字符。

重复以上步骤,直到处理字符串的最后一个字符,然后将当前结点标记为字符串的结尾。

查找前缀

我们从字典树的根开始,查找前缀。对于当前字符对应的子结点,有两种情况:

  • 子结点存在。沿着指针移动到子结点,继续搜索下一个字符。
  • 子结点不存在。说明字典树中不包含该前缀,返回空指针。

重复以上步骤,直到返回空指针或搜索完前缀的最后一个字符。

若搜索到了前缀的末尾,就说明字典树中存在该前缀。此外,若前缀末尾对应结点的 i s E n d isEnd isEnd 为真,则说明字典树中存在该字符串。

public class Trie {
    private Trie[] children;
    private boolean isEnd;

    public Trie() {
        children = new Trie[26];
        isEnd = false;
    }

    public void insert(String word) {
        Trie node = this;
        for (int i = 0; i < word.length(); i++) {
            char ch = word.charAt(i);
            int index = ch - 'a';
            if (node.children[index] == null) {
                node.children[index] = new Trie();
            }
            node = node.children[index];
        }
        node.isEnd = true;
    }

    public boolean search(String word) {
        Trie node = searchPrefix(word);
        return node != null && node.isEnd;
    }

    private Trie searchPrefix(String prefix) {
        Trie node = this;
        for (int i = 0; i < prefix.length(); i++) {
            char ch = prefix.charAt(i);
            int index = ch - 'a';
            if (node.children[index] == null) {
                return null;
            }
            node = node.children[index];
        }
        return node;
    }

    public boolean startsWith(String prefix) {
        return searchPrefix(prefix) != null;
    }
}
### 红黑树概念 红黑树是一种特殊的二叉搜索树,具有特定的颜色属性来保持树的近似平衡状态。这种特性使得红黑树能够在插入、删除和查找操作上提供较好的时间复杂度[^1]。 #### 性质描述 每棵红黑树都遵循以下五条基本性质: - 每个节点要么是红色,要么是黑色。 - 根节点总是黑色。 - 所有叶子(NIL节点)都是黑色。(注意这里的叶子指的是外部节点) - 如果一个内部节点是红色,则它的两个孩子节点必须是黑色。(即不存在连续两条红线相连的情况) - 对于任意给定的非叶节点,在该节点到其可达叶子的所有路径上的黑色节点数目相同。 这些规则确保了从根到最近叶子的最大距离不会超过最小距离的一倍以上,从而维持了一种较为均衡的状态[^3]。 ### 插入机制解析 当向红黑树中添加新的键值时,默认情况下新加入的节点会被标记成红色以减少违反上述条件的可能性。然而即便如此仍可能出现冲突情况——比如父级也为红色就违背了第四条原则;这时就需要通过一系列调整动作使整棵树恢复合法形态,主要包括颜色翻转以及左旋/右旋两种方式[^2]。 ```c // 定义RBTree结构体表示整个红黑树, Node代表单个节点. typedef struct RBTreeNode { int key; char color; // 'R' or 'B' struct RBTreeNode *left,*right,*parent; }Node; void insertFixup(Node* root, Node* z){ while (z != root && z->parent->color == RED) { ... } } ``` 此段伪代码展示了如何处理因插入而导致的不平衡状况的一部分逻辑流程,具体细节取决于实际应用场景下的需求设计。 ### 删除算法概览 移除某个指定元素的过程相对更为复杂一些,除了要考虑常规BST中的前驱后继关系外还需特别关注被删去位置处所遗留下来的空缺是否会引起连锁反应进而影响全局稳定性。为此通常采用替换法先找到合适替代品再做进一步修正工作直至完全消除负面影响为止。 ```c Node* treeMinimum(Node* node){ while(node->left!=NULL)node=node->left; return node; } void deleteFixup(RBTree T, Node x){...} ``` 这里给出了一些辅助函数用于支持完整的删除功能实现,其中`treeMinimum()`用来获取某子树中最左侧的那个节点作为候选接替者之一,“deleteFixup()”则负责后续必要的结构调整任务以确保存储结构依然符合预期标准。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

张无忌打怪兽

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值