【洛谷3796】【模板】AC自动机(加强版)

本文介绍了一道AC自动机的模板题,通过构建AC自动机来找出文本串中出现次数最多的模式串。首先将模式串插入Trie树,并记录每个模式串对应的节点。接着构建AC自动机的失配指针,最后遍历文本串统计每个模式串的出现次数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

点此看题面

大致题意: 一道模板题,给你 N N N个模式串和一个文本串,要你求出在文本串中出现次数最多的若干个模式串并输出它们。


A C AC AC自动机

都说了是 A C AC AC自动机的模板题,做法肯定是 A C AC AC自动机。

L i n k Link Link

A C AC AC自动机 详见博客 初学AC自动机


题解

我们可以考虑在将每个模式串插入 T r i e Trie Trie后,记录下每个模式串最后到达的节点。

然后,在 A C AC AC自动机时,将每一个经过的节点的访问次数加1。

最后统计答案时,只要求出最后到达的节点被访问次数最大的若干个模式串并输出即可,应该可以算是一道比较裸的模板题。


代码
#include<bits/stdc++.h>
#define max(x,y) ((x)>(y)?(x):(y))
#define min(x,y) ((x)<(y)?(x):(y))
#define LL long long
#define swap(x,y) (x^=y,y^=x,x^=y)
#define pc(ch) (pp_<100000?pp[pp_++]=(ch):(fwrite(pp,1,100000,stdout),pp[(pp_=0)++]=(ch)))
#define N 150
#define SUM 1000000
int pp_=0;char pp[100000];
using namespace std;
int n,tot=1,rt=1,ans=0,f[N+5];
struct Trie
{
    int Son[26],Vis,Next;
}node[SUM+5];
string s[N+5],st;
queue<int> q;
vector<int> res;
inline void write(int x)
{
    if(x>9) write(x/10);
    pc(x%10+'0');
}
inline void ps(string x)
{
    register int i,len=x.length();
    for(i=0;i<len;++i) pc(x[i]);
}
inline void Insert(int pos,string s)//将编号为pos的模式串s插入字典树中
{
    register int i;int x=rt;
    for(i=0;i<s.length();++i)
    {
        int p=s[i]-97;
        if(!node[x].Son[p]) node[x].Son[p]=++tot;
        x=node[x].Son[p];
    }
    f[pos]=x;//记录当前模式串最后到达的节点
}
inline void GetNext()//求出失配指针
{
    register int i,k;q.push(rt);
    while(!q.empty())
    {
        k=q.front(),q.pop();
        for(i=0;i<26;++i)
        {
            if(k^rt)
            {
                if(!node[k].Son[i]) node[k].Son[i]=node[node[k].Next].Son[i];
                else node[node[k].Son[i]].Next=node[node[k].Next].Son[i],q.push(node[k].Son[i]);
            }
            else 
            {
                if(!node[k].Son[i]) node[k].Son[i]=rt;
                else node[node[k].Son[i]].Next=rt,q.push(node[k].Son[i]);
            }
        }
    }
}
inline void AC_Automation()//AC自动机的核心代码
{
    register int i;int x=rt,len=st.length();
    for(i=0;i<len;++i)
    {
        if(!(x=node[x].Son[st[i]-97])) {x=rt;continue;}
        int p=x;
        while(p^rt) ++node[p].Vis,p=node[p].Next;//将每一个节点的访问次数加1
    }
}
int main()
{
    register int i,j;
    while(~scanf("%d",&n)&&n)
    {
        for(ans=0,i=1;i<=tot;++i) for(node[i].Next=node[i].Vis=j=0;j<26;++j) node[i].Son[j]=0;
        for(tot=i=1;i<=n;++i) cin>>s[i],Insert(i,s[i]);
        for(cin>>st,GetNext(),AC_Automation(),i=1;i<=n;++i) 
        {
            if(node[f[i]].Vis>ans) ans=node[f[i]].Vis,res.clear(),res.push_back(i);//比较当前模式串所对应的Trie上的节点被访问的次数与ans的大小,如果当前模式串出现的次数大于ans,就更新ans
            else if(node[f[i]].Vis==ans) res.push_back(i);//否则,如果当前模式串出现的次数等于ans,就将当前模式串加入最后要输出的数组中
        }
        for(write(ans),pc('\n'),i=0;i<res.size();++i) ps(s[res[i]]),pc('\n');
    }
    return fwrite(pp,1,pp_,stdout),0;
}
### 关于洛谷 P3167 使用 AC 自动机的解题思路 对于洛谷 P3167 的求解,可以采用 AC 自动机来处理多模式字符串匹配问题。此算法不仅能够高效地构建 Trie 树结构用于存储所有模式串,还通过建立失败指针(fail)使得能够在遇到不匹配情况时快速跳转到可能继续匹配的位置。 #### 构建Trie树并插入单词 为了实现这一目标,在初始化阶段需先遍历每一个给定的关键字,并将其逐字符加入至已有的前缀树(Trie Tree)当中形成节点连接关系[^1]。当某个新字母未能找到对应的子节点时,则创建新的分支;而一旦完成整个关键字路径铺设之后便标记终点表示存在以此序列结尾的有效词条。 ```cpp void insert(const string &s){ int p = root; for(auto c : s){ int u = c - 'a'; if(!tr[p][u]) tr[p][u] = ++idx; p = tr[p][u]; } cnt[p]++; } ``` #### 建立fail指针 接下来要做的就是利用队列广度优先搜索(BFS)的方式为每个非根节点分配其失配后的转移位置即 fail 指向。具体做法是从根开始一层层向下扩展直到覆盖全部内部顶点为止。每当从当前考察对象出发沿某条边e到达另一端v时,若发现 v 已经被访问过则直接令 `fail[v]=get_fail(u)` 后更新其他属性如 end 数组记录经过此处能结束几个词等信息;反之应当把 v 加入等待列表以便后续操作[^2]。 ```cpp queue<int> q; for (int i = 0; i < A; i++) { int t = tr[root][i]; if(t){q.push(t);fail[t]=root;} } while (!q.empty()) { auto t=q.front();q.pop(); for(int i=0;i<A;i++){ int j=tr[t][i]; if(!j){tr[t][i]=tr[fail[t]][i];continue;} q.push(j); fail[j]=tr[fail[t]][i]; } } ``` #### 查询过程中的应用 最后进入查询环节,此时输入待检验文本流text并通过循环读取其中各个组成成分尝试在先前搭建好的框架内定位是否存在相吻合的部分。每成功推进一位都意味着找到了至少一个公共开头片段,与此同时借助之前设定好的辅助机制(比如end[])统计出实际命中次数作为输出结果的一部分呈现出来[^3]。 ```cpp int query(string str) { int res=0,p=root; for(char ch:str){ int d=ch-'a'; p=tr[p][d]; int temp=p; while(temp!=root){ res+=cnt[temp]; cnt[temp]=0;//防止重复计算 temp=fail[temp]; } } return res; } ``` 上述代码展示了如何运用AC自动机解决洛谷P3167的问题核心部分———即构造Trie图、设置失效函数以及执行查找任务的具体流程。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值