ac自动机算法模板

本文深入探讨了多模式串匹配算法,特别是如何利用字典树优化匹配过程,通过建立fail指针加速查找,以及如何在文本串中高效地找到模式串的出现次数。文章详细解释了插入模式串、创建fail指针以及选择字符串进行匹配的具体实现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.多模式串匹配

2 .在模式串she ,he,h 和文本串 shesheshe进行匹配 在两个匹配的模式串中找到的最长的后缀,因为在字典树中 eg:先匹配s 1.然后匹配了sh,在文本串中sh已经匹配过了,而sh在字典树中只会有一条路径,因为文本串中的sh已经匹配了,为了优化时间,我们可以找到sh的最长后缀模式串 h,

2.继续匹配she后,在文本串中she已经匹配过了,而she在字典树中只会有一条路径,因为文本串中的she已经匹配了,为了优化时间,我们可以找到she的最长后缀模式串 he,如果he 没有就去匹配模式串e

”比如说,在我举的例子中,当我们匹配到了she时,我们在树上走的路径也包含了he,he是she的一个后缀。我们在she上失配,至少说明我们已经匹配到了he,于是就可以跳到代表he的节点上继续匹配。

3 建立fail指针((根结点处在最高处)由低处指向高处)通过BFS 第二层结点的fail指针要做特殊处理

 

找到模式串在文本串出现的次数:

#include<bits/stdc++.h>
using namespace std;
const int maxn = 2e+6;
const int maxsize = 26;
int tree[maxn][maxsize];
int fail[maxn];
int num[maxn];
int pos=0;
int sum=0;
void insert(string str){
	int length = str.size();
	int root=0;
	for(int i=0;i<length;i++){
		int index = str[i]-'a';
		if(!tree[root][index]) 
			tree[root][index] = ++pos;
		root=tree[root][index];
	}
	num[root]++;
}
void create_fail(){
	
	int root=0;
	queue<int> q;
	for(int i=0;i<maxsize;i++){
		if(tree[root][i]){
			q.push(tree[root][i]);
			fail[tree[root][i]]=0;	
		}
		
	}
	while(!q.empty()){
		int now = q.front();
		q.pop();
		for(int i=0;i<maxsize;i++){
			if(tree[now][i]){
				fail[tree[now][i]]=tree[fail[tree[now][i]]][i];
				q.push(tree[now][i]);
			}else{
				tree[now][i]=tree[fail[tree[now][i]]][i];
			}
		}
	}
}

void select(string str){
	int length = str.size();
	for(int i=0;i<length;i++){
		int index = str[i]-'a';
		int now = tree[now][index];
		for(int j=now;j;j=fail[j]){
			sum+=num[now];
		}
	}
}
int main(){
	int n;
	string ss;
	cin>>n;
	for(int i=0;i<n;i++){
		cin>>ss;
		insert(ss);
	}
	create_fail();
	cin>>ss;
	select(ss);
	cout<<sum<<endl;
	return 0;
}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值