字典树——单词查找树

博客围绕牛客网的一道题目展开,题目要求统计单词列表对应的单词查找树的节点数。介绍了单词查找树的特点,给出输入输出示例。思路是先存储字符串,进行字典序排序,计算两两单词相同前缀,插入不同字符。最后提到要注意细节。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

链接:https://ac.nowcoder.com/acm/problem/16864
来源:牛客网

题目描述

在进行文法分析的时候,通常需要检测一个单词是否在我们的单词列表里。为了提高查找和定位的速度,通常都要画出与单词列表所对应的单词查找树,其特点如下:
l 根节点不包含字母,除根节点外每一个节点都仅包含一个大写英文字母;
l 从根节点到某一节点,路径上经过的字母依次连起来所构成的字母序列,称为该节点对应的单词。单词列表中的每个词,都是该单词查找树某个节点所对应的单词;
l 在满足上述条件下,该单词查找树的节点数最少。
例:图一的单词列表对应图二的单词查找树
在这里插入图片描述

对一个确定的单词列表,请统计对应的单词查找树的节点数(包括根节点)
输入描述:
为一个单词列表,每一行仅包含一个单词和一个换行/回车符。每个单词仅由大写的英文字符组成,长度不超过63个字符。文件总长度不超过32K,至少有一行数据。
输出描述:
该文件中仅包含一个整数和一个换行/回车符。该整数为单词列表对应的单词查找树的节点数。

输入:
A
AN
ASP
AS
ASC
ASCII
BAS
BASIC

输出:
13
思路:开始以为要建树,后来发现不能建树,并且32k,这树的得多大,Orz,后来偷看了别人得思路,先把所有得字符串存起来,再对其进行字典序排序,再依次计算两两单词的相同前缀,要插入的字符即是当前与上一个不相同的,最后细节注意一下就可以了orz
代码:

#include<bits/stdc++.h>
using namespace std;
string a[5005];
int main(){
    int n=0,sum=0,j;
    while(cin>>a[n++]);
    sort(a,a+n);
    sum+=a[0].length();
    for(int i=1;i<n;i++){
        j=0;
        while(a[i][j]==a[i-1][j]&&j<a[i-1].length()){
            j++;
        }
        sum+=(a[i].length()-j);
    }
    cout<<sum+1<<endl;
    return 0;
}
### 1337 单词查找树 (Trie) 的实现 #### 节点数据结构定义 在 Trie 中,节点的数据结构通常包含两个部分:子节点指针集合和标志位。子节点指针集合作为一个长度为 `R` 的数组(`R` 是字符集中字符的数量),表示当前节点的每一个可能分支;标志位用来标记该节点是否一个完整单词的结束位置。 以下是 Python 实现的一个简单节点类: ```python class TrieNode: def __init__(self): self.children = {} # 子节点映射关系 self.is_end_of_word = False # 是否单词结尾 ``` [^1] #### 插入方法 插入操作的核心在于逐字符遍历输入字符串,并沿着路径创建新节点直到完成整个字符串的处理。如果某一层级已经存在对应字符,则无需重新创建节点,只需继续向下移动即可。 下面是基于上述节点类的插入函数实现: ```python class Trie: def __init__(self): self.root = TrieNode() def insert(self, word: str) -> None: node = self.root for char in word: if char not in node.children: node.children[char] = TrieNode() node = node.children[char] node.is_end_of_word = True ``` [^2] #### 单词方法 为了判断某个特定单词是否存在於 Trie 结构之中,可以通过从根节点开始逐步匹配给定字符串中的每个字符来进行检索。一旦发现不匹配或者到达终点而未找到完整的单词则返回失败结果。 下面展示了一个简单的搜索功能实现方式: ```python def search(self, word: str) -> bool: node = self.root for char in word: if char not in node.children: return False node = node.children[char] return node.is_end_of_word ``` [^3] #### 询前缀方法 与询整词相似,只是不需要关心最终节点是否有 `is_end_of_word=True` 属性设置与否。只要能够顺利通过所有指定字符就认为找到了相应前缀。 这提供了一段关于如何检测前缀存在的代码片段: ```python def starts_with(self, prefix: str) -> bool: node = self.root for char in prefix: if char not in node.children: return False node = node.children[char] return True ``` #### 前缀树的时间复杂度分析 对于标准形式下的 Trie ,其基本操作如插入、删除以及找均具有 O(L) 时间复杂度特性,其中 L 表示目标字符串长度。这是因为每次执行这些动作都需要访问至多等于待处理项总长数量级次序上的节点数目所致。 #### 应用场景举例说明 - **自动补全**: 当用户在一个文本框打字时,可以根据已有的数据库快速给出建议列表。 - **拼写检器**: 提供即时反馈指出错误并推荐改正方案。 - **IP路由表管理**: 高效地定位最佳匹配地址范围。 #### 扩展方向探讨 除了基础版本外还有几种优化后的变体可供选择: - **压缩前缀树(Compact Prefix Tree)** 或者叫作 Radix Tree,在某些情况下能更节省内存空间; - **Double Array Trie**, 它提供了固定时间内随机存取的能力同时保持较低的空间开销。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值