洛谷 P3804 【模板】后缀自动机

本文介绍了一种解决特定字符串问题的方法,通过构建后缀自动机(SAM)来高效统计字符串中所有出现次数不为1的子串,并计算这些子串出现次数与其长度乘积的最大值。文章详细阐述了解题思路及实现过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目描述
给定一个只包含小写字母的字符串 SS ,
请你求出 S 的所有出现次数不为 11 的子串的出现次数乘上该子串长度的最大值。

输入输出格式

输入格式:
一行一个仅包含小写字母的字符串 S

输出格式:
一个整数,为 所求答案

输入输出样例

输入样例#1:
abab
输出样例#1:
4
说明

对于 10%10% 的数据, |S|<=1000|S|<=1000
对于 100%100% 的数据, |S|<=106|S|<=106

分析:
好不容易搞懂了这玩意……
不能给cloneclone的点的sizesize设为11
子串的出现次数就是right集大小,一个节点的字符串的lenlen的集合为(t[fail[i]].len,t[i].len](t[fail[i]].len,t[i].len]。显然要求最大,直接用当前点最大更新答案即可。
然后就没有了。

代码:

// luogu-judger-enable-o2
#include <iostream>
#include <cmath>
#include <cstdio>
#include <cstring>
#include <algorithm>
#define LL long long

const int maxn=2e6+7;

using namespace std;

char s[maxn];
int n,cnt;
int top[maxn],b[maxn];

struct node{
    int len,fail,size;
    int son[26];
}t[maxn];

void build_sam()
{
    int now=1,p,np,q,nq;
    cnt=1;  
    for (int i=0;i<n;i++)
    {
        int c=s[i]-'a';
        p=now;
        now=np=++cnt;
        t[np].len=t[p].len+1;
        while (p&&(!t[p].son[c])) t[p].son[c]=np,p=t[p].fail;
        if (p==0) t[np].fail=1;
        else
        {
            q=t[p].son[c];
            if (t[p].len+1==t[q].len) t[np].fail=q;
            else
            {               
                nq=++cnt;
                t[nq]=t[q];
                t[nq].size=0;   
                t[nq].len=t[p].len+1;
                t[q].fail=t[np].fail=nq;
                while (p&&(t[p].son[c]==q)) t[p].son[c]=nq,p=t[p].fail;
            }
        }
        t[np].size=1;
    }
}

void calc()
{   
    for (int i=1;i<=cnt;i++) b[t[i].len]++;
    for (int i=n;i>0;i--) b[i]+=b[i+1];
    for (int i=1;i<=cnt;i++) top[b[t[i].len]--]=i;  
    for (int i=1;i<=cnt;i++) t[t[top[i]].fail].size+=t[top[i]].size;            
    LL ans=0;   
    for (int i=1;i<=cnt;i++)
    {
        if (t[i].size>1) ans=max(ans,(LL)t[i].len*t[i].size);
    }
    printf("%lld\n",ans);
}

int main()
{
    scanf("%s",s);
    n=strlen(s);
    build_sam();    
    calc();
}
### 关于洛谷 P3167 使用 AC 自动机的解题思路 对于洛谷 P3167 的求解,可以采用 AC 自动机来处理多模式字符串匹配问题。此算法不仅能够高效地构建 Trie 树结构用于存储所有模式串,还通过建立失败指针(fail)使得能够在遇到不匹配情况时快速跳转到可能继续匹配的位置。 #### 构建Trie树并插入单词 为了实现这一目标,在初始化阶段需先遍历每一个给定的关键字,并将其逐字符加入至已有的前缀树(Trie Tree)当中形成节点连接关系[^1]。当某个新字母未能找到对应的子节点时,则创建新的分支;而一旦完成整个关键字路径铺设之后便标记终点表示存在以此序列结尾的有效词条。 ```cpp void insert(const string &s){ int p = root; for(auto c : s){ int u = c - 'a'; if(!tr[p][u]) tr[p][u] = ++idx; p = tr[p][u]; } cnt[p]++; } ``` #### 建立fail指针 接下来要做的就是利用队列广度优先搜索(BFS)的方式为每个非根节点分配其失配后的转移位置即 fail 指向。具体做法是从根开始一层层向下扩展直到覆盖全部内部顶点为止。每当从当前考察对象出发沿某条边e到达另一端v时,若发现 v 已经被访问过则直接令 `fail[v]=get_fail(u)` 后更新其他属性如 end 数组记录经过此处能结束几个词等信息;反之应当把 v 加入等待列表以便后续操作[^2]。 ```cpp queue<int> q; for (int i = 0; i < A; i++) { int t = tr[root][i]; if(t){q.push(t);fail[t]=root;} } while (!q.empty()) { auto t=q.front();q.pop(); for(int i=0;i<A;i++){ int j=tr[t][i]; if(!j){tr[t][i]=tr[fail[t]][i];continue;} q.push(j); fail[j]=tr[fail[t]][i]; } } ``` #### 查询过程中的应用 最后进入查询环节,此时输入待检验文本流text并通过循环读取其中各个组成成分尝试在先前搭建好的框架内定位是否存在相吻合的部分。每成功推进一位都意味着找到了至少一个公共开头片段,与此同时借助之前设定好的辅助机制(比如end[])统计出实际命中次数作为输出结果的一部分呈现出来[^3]。 ```cpp int query(string str) { int res=0,p=root; for(char ch:str){ int d=ch-'a'; p=tr[p][d]; int temp=p; while(temp!=root){ res+=cnt[temp]; cnt[temp]=0;//防止重复计算 temp=fail[temp]; } } return res; } ``` 上述代码展示了如何运用AC自动机解决洛谷P3167的问题核心部分———即构造Trie图、设置失效函数以及执行查找任务的具体流程。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值