洛谷 P3804 【模板】后缀自动机 统计单词出现次数

本文介绍了解决洛谷P3804问题的方法,使用后缀自动机模板进行单词出现次数的统计。通过构建后缀自动机并更新节点的right属性,实现对字符串中子串频率的有效计算。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

洛谷 P3804 【模板】后缀自动机 统计单词出现次数

后缀自动机模板题.

关键时求解每个节点的 $right$ 大小.

由于后缀自动机在构建时会保证点和点的 $right$ 只可能没有交集,或者一个是另一个的真子集,我们可以不重复的对 $right$ 进行统计与更新.

从长度大的子串向前更新,沿着 $parent$ 跳即可.

最后再枚举一下.

Code:

#include <cstdio>
#include <algorithm>
#include <cstring>
#define setIO(s) freopen(s".in","r",stdin)
#define maxn 3000000
#define N 30 
#define ll long long
using namespace std;
int last=1,tot=1,n; 
int ch[maxn][N],cnt[maxn],f[maxn],dis[maxn],rk[maxn]; 
ll C[maxn],ans; 
char str[maxn]; 
struct Suffix_Automaton{
    void ins(int c){
        int p=last,np=++tot; last=np; dis[np]=dis[p]+1; 
        while(p&&!ch[p][c])ch[p][c]=np,p=f[p];
        if(!p) f[np]=1;
        else{
            int q=ch[p][c],nq;  
            if(dis[q]==dis[p]+1) f[np]=q;
            else{
                nq=++tot; 
                dis[nq]=dis[p]+1;
                memcpy(ch[nq],ch[q],sizeof(ch[q]));
                f[nq]=f[q],f[q]=f[np]=nq;
                while(p&&ch[p][c]==q) ch[p][c]=nq,p=f[p]; 
            } 
        }
        cnt[last]=1; 
    }
}sam; 
int main(){
    //setIO("input");
    scanf("%s",str),n=strlen(str);
    for(int i=0;i<n;++i) sam.ins(str[i]-'a'); 
    for(int i=1;i<=tot;++i) ++C[dis[i]]; 
    for(int i=1;i<=tot;++i) C[i]+=C[i-1];  
    for(int i=1;i<=tot;++i) rk[C[dis[i]]--]=i;
    for(int i=tot;i>=1;--i){
        int p=rk[i];
        cnt[f[p]]+=cnt[p];
        if(cnt[p]>1) ans=max(ans,(ll)cnt[p]*dis[p]); 
    }
    printf("%lld",ans); 
    return 0;
}

  

posted @ 2019-01-19 01:22 EM-LGH 阅读( ...) 评论( ...) 编辑 收藏
### 关于洛谷 P3167 使用 AC 自动机的解题思路 对于洛谷 P3167 的求解,可以采用 AC 自动机来处理多模式字符串匹配问题。此算法不仅能够高效地构建 Trie 树结构用于存储所有模式串,还通过建立失败指针(fail)使得能够在遇到不匹配情况时快速跳转到可能继续匹配的位置。 #### 构建Trie树并插入单词 为了实现这一目标,在初始化阶段需先遍历每一个给定的关键字,并将其逐字符加入至已有的前缀树(Trie Tree)当中形成节点连接关系[^1]。当某个新字母未能找到对应的子节点时,则创建新的分支;而一旦完成整个关键字路径铺设之后便标记终点表示存在以此序列结尾的有效词条。 ```cpp void insert(const string &s){ int p = root; for(auto c : s){ int u = c - 'a'; if(!tr[p][u]) tr[p][u] = ++idx; p = tr[p][u]; } cnt[p]++; } ``` #### 建立fail指针 接下来要做的就是利用队列广度优先搜索(BFS)的方式为每个非根节点分配其失配后的转移位置即 fail 指向。具体做法是从根开始一层层向下扩展直到覆盖全部内部顶点为止。每当从当前考察对象出发沿某条边e到达另一端v时,若发现 v 已经被访问过则直接令 `fail[v]=get_fail(u)` 后更新其他属性如 end 数组记录经过此处能结束几个词等信息;反之应当把 v 加入等待列表以便后续操作[^2]。 ```cpp queue<int> q; for (int i = 0; i < A; i++) { int t = tr[root][i]; if(t){q.push(t);fail[t]=root;} } while (!q.empty()) { auto t=q.front();q.pop(); for(int i=0;i<A;i++){ int j=tr[t][i]; if(!j){tr[t][i]=tr[fail[t]][i];continue;} q.push(j); fail[j]=tr[fail[t]][i]; } } ``` #### 查询过程中的应用 最后进入查询环节,此时输入待检验文本流text并通过循环读取其中各个组成成分尝试在先前搭建好的框架内定位是否存在相吻合的部分。每成功推进一位都意味着找到了至少一个公共开头片段,与此同时借助之前设定好的辅助机制(比如end[])统计出实际命中次数作为输出结果的一部分呈现出来[^3]。 ```cpp int query(string str) { int res=0,p=root; for(char ch:str){ int d=ch-'a'; p=tr[p][d]; int temp=p; while(temp!=root){ res+=cnt[temp]; cnt[temp]=0;//防止重复计算 temp=fail[temp]; } } return res; } ``` 上述代码展示了如何运用AC自动机解决洛谷P3167的问题核心部分———即构造Trie图、设置失效函数以及执行查找任务的具体流程。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值