单词查找树

本文介绍了一种高效的数据结构——单词查找树(Trie),用于快速检测单词是否存在于列表中。通过对每个单词逐字符构建树形结构,文章提供了一个C++实现示例,并详细解释了如何最小化结点数量。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

单词查找树

问题 C: 单词查找树
时间限制: 1 Sec 内存限制: 128 MB
提交: 33 解决: 25
[提交][状态][讨论版]
题目描述
在进行文法分析的时候,通常需要检测一个单词是否在我们的单词列表里。为了提高查找和定位的速度,通常都画出与单词列表所对应的单词查找树,其特点如下:

1.根结点不包含字母,除根结点外每一个结点都仅包含一个大写英文字母;

2.从根结点到某一结点,路径上经过的字母依次连起来所构成的字母序列,称为该结点对应的单词。单词列表中的每个单词,都是该单词查找树某个结点所对应的单词;

3.在满足上述条件下,该单词查找树的结点数最少。

4.例如图左边的单词列表就对应于右边的单词查找树。注意,对一个确定的单词列表,请统计对应的单词查找树的结点数(包含根结点)。

输入
输入一个单词列表,每一行仅包含一个单词和一个换行/回车符。每个单词仅由大写的英文字母组成,长度不超过63个字母 。输入文件总长度不超过32K,至少有一行数据。

输出
输出一个整数,该整数为单词列表对应的单词查找树的结点数。

样例输入
A
AN
ASP
AS
ASC
ASCII
BAS
BASIC

样例输出
13

#include<iostream>
#include<cstring>
#include<cstdlib>
#include<cstdio>
#include<algorithm>
#include<cmath>
#include<stack>
#define MAXN 500001
#define LL long long
using namespace std;
struct Trie
{
  int dfn;
  Trie *ch[30];       
}node[MAXN],*root;
int f[MAXN],n,t,sz,ans;
inline Trie* newnode()
{
  ***sz++;***
  return &node[sz];       
}
inline void insert(char *s)
{
  int len=strlen(s);
  Trie *now=root;
  ++t;
  for(int i=0;i<len;i++)
  {
    if(now->ch[s[i]-'A']==NULL)
    now->ch[s[i]-'A']=newnode();
    now=now->ch[s[i]-'A'];
  } 
  now->dfn=t; 
}
int main()
{
  //freopen("in.txt","r",stdin);freopen("out.txt","w",stdout);
 //freopen("trie.in","r",stdin);freopen("trie.out","w",stdout);
 root=newnode();
 char s[100];
  while(~scanf("%s",s))
  {
      insert(s);  
  }      
 cout<<sz<<endl;       
  return 0;    
}
### 1337 单词查找树 (Trie) 的实现 #### 节点数据结构定义 在 Trie 中,节点的数据结构通常包含两个部分:子节点指针集合和标志位。子节点指针集合作为一个长度为 `R` 的数组(`R` 是字符集中字符的数量),表示当前节点的每一个可能分支;标志位用来标记该节点是否是一个完整单词的结束位置。 以下是 Python 实现的一个简单节点类: ```python class TrieNode: def __init__(self): self.children = {} # 子节点映射关系 self.is_end_of_word = False # 是否为单词结尾 ``` [^1] #### 插入方法 插入操作的核心在于逐字符遍历输入字符串,并沿着路径创建新节点直到完成整个字符串的处理。如果某一层级已经存在对应字符,则无需重新创建节点,只需继续向下移动即可。 下面是基于上述节点类的插入函数实现: ```python class Trie: def __init__(self): self.root = TrieNode() def insert(self, word: str) -> None: node = self.root for char in word: if char not in node.children: node.children[char] = TrieNode() node = node.children[char] node.is_end_of_word = True ``` [^2] #### 查询单词方法 为了判断某个特定单词是否存在於 Trie 结构之中,可以通过从根节点开始逐步匹配给定字符串中的每个字符来进行检索。一旦发现不匹配或者到达终点而未找到完整的单词则返回失败结果。 下面展示了一个简单的搜索功能实现方式: ```python def search(self, word: str) -> bool: node = self.root for char in word: if char not in node.children: return False node = node.children[char] return node.is_end_of_word ``` [^3] #### 查询前缀方法 与查询整词相似,只是不需要关心最终节点是否有 `is_end_of_word=True` 属性设置与否。只要能够顺利通过所有指定字符就认为找到了相应前缀。 这里提供了一段关于如何检测前缀存在的代码片段: ```python def starts_with(self, prefix: str) -> bool: node = self.root for char in prefix: if char not in node.children: return False node = node.children[char] return True ``` #### 前缀树的时间复杂度分析 对于标准形式下的 Trie ,其基本操作如插入、删除以及查找均具有 O(L) 时间复杂度特性,其中 L 表示目标字符串长度。这是因为每次执行这些动作都需要访问至多等于待处理项总长数量级次序上的节点数目所致。 #### 应用场景举例说明 - **自动补全**: 当用户在一个文本框里打字时,可以根据已有的数据库快速给出建议列表。 - **拼写检查器**: 提供即时反馈指出错误并推荐改正方案。 - **IP路由表管理**: 高效地定位最佳匹配地址范围。 #### 扩展方向探讨 除了基础版本外还有几种优化后的变体可供选择: - **压缩前缀树(Compact Prefix Tree)** 或者叫作 Radix Tree,在某些情况下能更节省内存空间; - **Double Array Trie**, 它提供了固定时间内随机存取的能力同时保持较低的空间开销。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值