洛谷 P3804 【模板】后缀自动机 统计单词出现次数

本文介绍了解决洛谷P3804问题的方法,使用后缀自动机模板进行单词出现次数的统计。通过构建后缀自动机并更新节点的right属性,实现对字符串中子串频率的有效计算。

洛谷 P3804 【模板】后缀自动机 统计单词出现次数

后缀自动机模板题.

关键时求解每个节点的 $right$ 大小.

由于后缀自动机在构建时会保证点和点的 $right$ 只可能没有交集,或者一个是另一个的真子集,我们可以不重复的对 $right$ 进行统计与更新.

从长度大的子串向前更新,沿着 $parent$ 跳即可.

最后再枚举一下.

Code:

#include <cstdio>
#include <algorithm>
#include <cstring>
#define setIO(s) freopen(s".in","r",stdin)
#define maxn 3000000
#define N 30 
#define ll long long
using namespace std;
int last=1,tot=1,n; 
int ch[maxn][N],cnt[maxn],f[maxn],dis[maxn],rk[maxn]; 
ll C[maxn],ans; 
char str[maxn]; 
struct Suffix_Automaton{
    void ins(int c){
        int p=last,np=++tot; last=np; dis[np]=dis[p]+1; 
        while(p&&!ch[p][c])ch[p][c]=np,p=f[p];
        if(!p) f[np]=1;
        else{
            int q=ch[p][c],nq;  
            if(dis[q]==dis[p]+1) f[np]=q;
            else{
                nq=++tot; 
                dis[nq]=dis[p]+1;
                memcpy(ch[nq],ch[q],sizeof(ch[q]));
                f[nq]=f[q],f[q]=f[np]=nq;
                while(p&&ch[p][c]==q) ch[p][c]=nq,p=f[p]; 
            } 
        }
        cnt[last]=1; 
    }
}sam; 
int main(){
    //setIO("input");
    scanf("%s",str),n=strlen(str);
    for(int i=0;i<n;++i) sam.ins(str[i]-'a'); 
    for(int i=1;i<=tot;++i) ++C[dis[i]]; 
    for(int i=1;i<=tot;++i) C[i]+=C[i-1];  
    for(int i=1;i<=tot;++i) rk[C[dis[i]]--]=i;
    for(int i=tot;i>=1;--i){
        int p=rk[i];
        cnt[f[p]]+=cnt[p];
        if(cnt[p]>1) ans=max(ans,(ll)cnt[p]*dis[p]); 
    }
    printf("%lld",ans); 
    return 0;
}

  

posted @ 2019-01-19 01:22 EM-LGH 阅读( ...) 评论( ...) 编辑 收藏
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值