Tire树 求出现次数最多单词

本文深入讲解了Trie树(字典树)的概念及其在实际应用中的实现细节,包括节点定义、遍历方法、堆更新策略等内容,并分析了其在查找前缀及统计单词出现频率的应用场景。

Tire树 又称字典树


       Tire树 核心的思想是以空间换时间,每个节点下面分26叉,需要统计一个单词比如abc,这时候先找根节点,然后由a分支到a节点,然后在a节点里面找b分支,然后到b节点去找c分支,最后将该节点的单词计数器加1.


1.Tire树每个节点的定义

class TireNode
{
public:
	char c;
	int count;
	TireNode *next[26];
	TireNode()
	{
		c='0';
		count=0;
		for(int i=0;i<26;i++)
			next[i]=NULL;
	}
	~TireNode()
	{
		for(int i=0;i<26;i++)
			if(next[i]!=NULL)
				delete  next[i];
	}
};


2.Tire树遍历

在统计完节点后,对其遍历,目前我只弄了一个递归的遍历,过几天研究非递归的遍历

在遍历的过程中同时用一个最小堆保存当前的出现频率最高的单词,如果一旦新遍历的单词出现的次数大于堆顶元素,更新堆

算法描述

1.给定Tire树节点,如果该节点为NULL返回

2.将其节点字母压栈,如果该节点计数器不为0,记录之,并且利用该信息更新堆操作

3.以本方法遍历其26个后继节点

4.弹栈操作

void Travel(TireNode *node)
{
	if(node==NULL)
		return;
	stk.PushIn(node->c);
	if(node->count!=0)
	{
		stk.PrintStack(node->count);
		heap.CMP(node->count,stk.GetTrace());
	}
	int i=0;
	for(;i<26;i++)
		Travel(node->next[i]);
	stk.Pop(); //这里注意弹栈不要影响将来遍历的轨迹
}


3.在遍历的过程中对于更新堆的思路

1.建立一个 出现次数--单词 的映射,每次调整堆的时候,单词也要交换,但是这样做复制单词比较耗时

2.在1的基础上建立两层映射  出现次数---索引---单词,这样一来每次每次只有在更新堆的时候有单词的复制,在调整堆的时候只需要将索引和次数一起调整即可,不用额外去复制单词。实现如下所示

void shift(int low,int high) //堆排序调整
	{
		int temp[1][2];
		temp[0][0]=map[low][0];    //记录次数
		temp[0][1]=map[low][1];    //记录索引
		int i=low;
		int j=2*i;
		int k;
		bool finshed=false;

		while(j<=high&&!finshed)
		{
			if(j<high&&map[j+1][0]<map[j][0])
				j=j+1;
			if(map[i][0]<map[j][0])
				finshed=true;
			else
			{
				k=map[i][0];
				map[i][0]=map[j][0];
				map[j][0]=k;

				k=map[i][1];
				map[i][1]=map[j][1];
				map[j][1]=k;
				i=j;
				j=2*i;
			}
		}
		map[i][0]=temp[0][0];
		map[i][1]=temp[0][1];
	}


Tire树在实际应用中一般用于查找单词的前缀,统计单词的出现的次数,Baidu 的Suggestion的实现就是基于Tire树的。


4.复杂度分析

Tire树在查找时同时可以完成插入操作,因此完成统计用时为O(N*len)

遍历的时候最坏情况下每次都要更新堆,用时为O(N*(logK+len))


5.在实现中遇到的问题

1.在字符串拷贝时候自增计数器要加上

2.堆排序在计算下标时候用到乘法,方便起见,下标从1开始而不是0

3.在调用函数时分配在栈上面的变量是不能返回的如 char str[20]


题目描述 给定一棵 $n$ 个节点的二叉,每个节点上有一个整数。二叉中某个子内的最大和最小数的异或和。 输入格式 第一行包含整数 $n$。 以下 $n$ 行每行描述二叉的一个节点,格式为 ID val lson rson,其中 ID 表示节点编号(范围 1∼n),val 是节点上的整数,lson 和 rson 分别表示该节点的左儿子和右儿子的编号。若节点没有左儿子或右儿子,则对应位置为 0。 输出格式 一个整数,表示异或和。 数据范围 1≤n≤10^5,−10^9≤val≤10^9 输入样例1: 5 1 1 2 3 2 2 4 5 3 3 0 0 4 4 0 0 5 5 0 0 输出样例1: 7 输入样例2: 9 1 1 2 3 2 2 4 5 3 3 6 7 4 4 8 9 5 5 0 0 6 6 0 0 7 7 0 0 8 8 0 0 9 9 0 0 输出样例2: 8 算法 (Trie ,后缀数组,分块) $O(n log n + n \log^2 mod)$ C++ 代码 用Trie实现 ``` #include<iostream> #include<cstring> #include<algorithm> #include<cstdio> #include<stdlib.h> #include<time.h> using namespace std; #define f(a,b,c) for(a=b;a<=c;a++) #define g(a,b,c) for(a=b;a>=c;a--) #define ll long long const ll INF=2e9; const int N=1e5+7,M=1e6+7; inline int read(){ int x=0,f=1;char ch=getchar(); while(ch<'0'||ch>'9') {if(ch=='-') f=-1; ch=getchar();} while(ch>='0'&&ch<='9') {x=(x<<1)+(x<<3)+ch-'0';ch=getchar();} return x*f; } int e[M],ne[M],h[N],idx; void add(int a,int b){e[idx]=b;ne[idx]=h[a];h[a]=idx++;} int fa[N],dep[N],sz[N],son[N],wson[N],dfn[N],dnt,ndfn[N],tp[N]; struct Trie{ int son[2],cnt; }tr[N*32]; int rt[N]; int cnt; void update(int u,int k){ int p=rt[u],q=rt[cnt++]; int i,j; rt[u]=q,tr[q]=tr[p]; f(i,30,0){ tr[q].cnt=tr[p].cnt+1; j=(k>>i)&1; if(tr[p].son[j]==0){ tr[q].son[0]=tr[p].son[0],tr[q].son[1]=tr[p].son[1]; tr[q].son[j]=cnt++,tr[tr[q].son[j]]=(Trie){0,0}; } p=tr[p].son[j],q=tr[q].son[j]; } tr[q].cnt=tr[p].cnt+1; } int query(int u,int v,int k){ int p=rt[u],q=rt[v],res=0; int i,j; f(i,30,0){ j=(k>>i)&1; if(tr[tr[q].son[j^1]].cnt>tr[tr[p].son[j^1]].cnt) res=res|(1<<i),q=tr[q].son[j^1],p=tr[p].son[j^1]; else q=tr[q].son[j],p=tr[p].son[j]; } return res; } void dfs1(int u,int la){ dep[u]=dep[la]+1,fa[u]=la,sz[u]=1; int i,v,maxn=-1; for(i=h[u];~i;i=ne[i]){ v=e[i]; if(v==la) continue; dfs1(v,u); sz[u]+=sz[v]; if(sz[v]>maxn) maxn=sz[v],son[u]=v; } } void dfs2(int u){ int i,v; dfn[u]=++dnt,ndfn[dnt]=u; if(son[u]) wson[son[u]]=dfn[son[u]],tp[son[u]]=tp[u],dfs2(son[u]); else return; for(i=h[u];~i;i=ne[i]){ v=e[i]; if(v==fa[u]||v==son[u]) continue; wson[v]=dfn[v],tp[v]=v,dfs2(v); } } int find(int u,int v){ int f1=tp[u],f2=tp[v]; int ans=0; while(f1!=f2){ if(dep[f1]<dep[f2]) swap(u,v),swap(f1,f2); ans=max(ans,query(wson[f1],wson[u],v)); u=fa[f1],f1=tp[u]; } if(u==v) return ans; if(dep[u]<dep[v]) swap(u,v); return max(ans,query(wson[son[v]],wson[u],v)); } int main(){ int n=read(); memset(h,-1,sizeof h); int i,a,b,c,ans1=0x3f3f3f3f,ans2=-0x3f3f3f3f; f(i,1,n){ a=read(),b=read(),c=read(); if(c){ add(a,c),add(c,a); add(b,c),add(c,b); } else{ add(a,b),add(b,a); } } dfs1(1,0),wson[1]=dfn[1],tp[1]=1,dfs2(1); rt[0]=cnt++,tr[rt[0]]=(Trie){0,0}; f(i,1,n){ a=ndfn[i]; rt[a]=rt[fa[a]]; update(a,read()); } f(i,1,n){ a=ndfn[i]; ans1=min(ans1,query(rt[1],rt[a],read())); ans2=max(ans2,query(rt[1],rt[a],read())); } cout<<ans1+ans2; return 0; } ``` '''
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值