P5357 【模板】AC自动机(二次加强版)

该博客主要介绍了如何使用AC自动机优化字符串匹配算法,通过建立fail树记录匹配次数,解决长重复字符导致的复杂度问题。文章详细讲解了AC自动机的构建过程,包括初始化、插入模式串、获取fail指针以及搜索和深度优先遍历的过程,并提供了完整的C++代码实现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

学习链接:点击进入
题目链接:点击进入
题目

在这里插入图片描述

思路

AC自动机在暴跳 fail 指针的时候,有时会被类似aaaaaaaaaaaa… …的串卡复杂度,所以就需要对原先的查询进行优化。 我们可以建出 fail 树,记录自动机上的每个状态被匹配了几次,最后求出每个模式串在 trie 上的终止节点在 fail 树上的子树总匹配次数就可以了。

代码
// #pragma GCC optimize("Ofast","inline","-ffast-math")
// #pragma GCC target("avx,sse2,sse3,sse4,mmx")
//#pragma GCC optimize(3)//O3
//#pragma GCC optimize(2)//O2
//#include<bits/stdc++.h>
#include<iostream>
#include<string>
#include<map>
#include<set>
//#include<unordered_map>
#include<queue>
#include<cstdio>
#include<vector>
#include<cstring>
#include<algorithm>
#include<iomanip>
#include<cmath>
#include<bitset>
#include<fstream>
#define X first
#define Y second
#define best 131 
#define INF 0x3f3f3f3f3f3f3f3f
#define pii pair<int,int>
#define lowbit(x) x & -x
#define inf 0x3f3f3f3f
#define max(a,b) a>b?a:b
#define min(a,b) a<b?a:b
//#define int long long
//#define double long double
//#ifndef ONLINE_JUDGE  freopen("data.in.txt","r",stdin);
//freopen("data.out.txt","w",stdout); #endif //文件读取 
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
const double pai=acos(-1.0);
const int Mod=998244353;
const double eps=1e-9;
const int N=26;
const int mod=51123987;
const int maxn=2e6+10;

/*--------------------------------------------*/ 
inline int read()
{
    int data=0,w=1; char ch=0;
    while(ch!='-' && (ch<'0' || ch>'9')) ch=getchar();
    if(ch=='-') w=-1,ch=getchar();
    while(ch>='0' && ch<='9') data=data*10+ch-'0',ch=getchar();
    return data*w;
}
/*--------------------------------------------*/

int trie[maxn][26]; //字典树
int fail[maxn];     //失败时的回溯指针
int pos[maxn];      //记录每个模式串在 trie 树上的终止节点 
int sum[maxn];      //记录匹配次数 
int cnt = 0;
int head[maxn],tot;
struct node
{
	int to;
	int next;
}edge[maxn];

void init()
{
	memset(trie,0,sizeof(trie));
	memset(sum,0,sizeof(sum));
	memset(fail,0,sizeof(fail));
	memset(head,-1,sizeof(head));
	memset(pos,0,sizeof(head));
	cnt=0;
	tot=0;
}
void add(int u,int v)
{
	edge[tot].to=v;
	edge[tot].next=head[u];
	head[u]=tot++;
}
void insert(int k,char *str)//插入第 k 个模式串 
{ 
    int p=0,len=strlen(str);
    for(int i=0;i<len;i++)
	{
        int c=str[i]-'a';
        if(!trie[p][c])
            trie[p][c]=++cnt;
        p=trie[p][c];
    }
    pos[k]=p;//第 k 个模式串的终止节点是 p 
}
void getfail()
{
    queue<int>q;
    for(int i=0;i<26;i++)//第二层的fail指针提前处理一下
	{                 
        if(trie[0][i])
		{
            fail[trie[0][i]]=0;//指向根节点
            q.push(trie[0][i]);
        }
    }
    while(!q.empty())
	{
        int now=q.front();
        q.pop();
        for(int i=0;i<26;i++)
		{      //查询26个字母
            if(trie[now][i])//存在这个子节点
			{
                fail[trie[now][i]]=trie[fail[now]][i]; 
                //子节点的fail指针指向当前节点的
                //fail指针所指向的节点的相同子节点
                q.push(trie[now][i]);
            }
            else//不存在这个子节点 当前节点的这个子节点指向当前节点fail指针的这个子节点 
                trie[now][i]=trie[fail[now]][i];
        }
    }
}

void search(char *str)
{
	int p=0,len=strlen(str);
	for(int i=0;i<len;i++)
	{
		p=trie[p][str[i]-'a'];
		sum[p]++;
	}
	return ;
}

void dfs(int p)
{
	for(int i=head[p];i!=-1;i=edge[i].next)
	{
		int v=edge[i].to;
		dfs(v);
		sum[p]+=sum[v];
	}
	return ;
}

char str1[maxn];
char str[maxn];
int t,n;

int main()																						
{	
//	ios::sync_with_stdio(false);
//	cin.tie(0);cout.tie(0);
	init();
	scanf("%d",&n);
	for(int i=1;i<=n;i++)
	{
		scanf("%s",str1);
		insert(i,str1);
	}
	getfail();
	for(int i=1;i<=cnt;i++)
		add(fail[i],i);
	scanf("%s",str);
	search(str);
	dfs(0);
	for(int i=1;i<=n;i++)
		printf("%d\n",sum[pos[i]]);
	return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值