Trie字符串统计

本文介绍了Trie树(字典树)这种高效的数据结构,用于存储和查找字符串。通过代码展示了如何利用son[N][26]数组来表示节点的儿子,cnt[N]记录以某个节点为结尾的字符串数量,idx确保节点的唯一性。插入和查询操作分别用于添加字符串到字典树和查找字符串是否存在。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Trie树又称字典树、单词查找树。是一种能够高效存储和查找字符串集合的数据结构。

代码中,我们用到了son[N][26],cnt[N],idx;

我们将26个英文字母转换成数0-26,N代表当前节点,son[N][]代表当前节点的儿子。如果没有的话,可以等于++idx。Trie树本质上是一颗多叉树,对于字母而言最多有26个子结点。所以这个数组包含了两条信息。比如:son[1][0]=2表示1结点的一个值为a的子结点为结点2;如果son[1][0] = 0,则意味着没有值为a子结点。这里的son[N][26]相当于链表中的ne[N]。

为了能够唯一标识化每个节点,需要让每个节点唯一不重复,因此这里用到了idx;

cnt[N]是用来存储以N为结尾的字符串的个数。

insert操作就是挨个字母查找son[][]是否为0,为0表示没有这个节点,所以就新建节点,给这个节点一个idx值。若不为0,就继续找儿子节点,直到字符串循环完毕。若全都存在,则以末尾字母为节点的个数加一。

#include<iostream>
#include<string>
using namespace std;
const int N=100010;
int son[N][26],cnt[N],idx;
char str[N];
void insert(char *str){
	int p=0;
	for(int i=0;str[i];i++){
		int u=str[i]-'a';
		if(!son[p][u]) son[p][u]=++idx;
		p=son[p][u];
	}
	cnt[p]++;
}
int query(char *str){
	int p=0;
	for(int i=0;str[i];i++){
		int u=str[i]-'a';
		if(!son[p][u]) return 0;
		p=son[p][u];
	}
	return cnt[p];
}
int main(){
	int m;
	cin>>m;
	while(m--){
		char op[2];
		scanf("%s%s",op,str);
		if(*op=='I') insert(str);
		else printf("%d\n",query(str));
	}
	return 0;
	
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值