再写ac自动机

本文深入解析AC自动机的工作原理及其在Trie树上的优化应用,通过一道洛谷P3808题目实例,详细介绍了如何构建和使用AC自动机进行字符串匹配,包括插入操作、构建失败指针和查询过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

/*
洛谷 p3808 
*/ 
#include<bits/stdc++.h>
using namespace std;
const int N=5e5+1000;
struct tire
{
	int c[N][26],val[N],fail[N],cnt;
	//字典树 
	void Insert(char *s){
		int len=strlen(s);int now=0;
		for(int i=0;i<len;i++){
			int v=s[i]-'a';
			if(!c[now][v]) c[now][v]=++cnt;
			now=c[now][v];
		}
		val[now]++;
	}
	
	//构造fail指针 
	void build(){
		queue<int>Q;
		for(int i=0;i<26;i++){//第二层的fail指针提前处理一下
			if(c[0][i]){
				fail[c[0][i]]=0;//指向根节点
				Q.push(c[0][i]);
			}
		}
		while(!Q.empty()){//bfs求fail指针 
			int u=Q.front();
			Q.pop();
			for(int i=0;i<26;i++){//枚举所有子节点 
				if(c[u][i]){//存在这个子节点 
					fail[c[u][i]]=c[fail[u]][i];
					 //子节点的fail指针指向当前节点的
                    //fail指针所指向的节点的相同子节点 
					Q.push(c[u][i]);
				}
				//不存在这个子节点
				else c[u][i]=c[fail[u]][i];
				//当前节点的这个子节点指向当
                //前节点fail指针的这个子节点 
			}
		} 
	}
	
	int query(char *s){//AC自动机匹配
		int len=strlen(s),now=0,ans=0;
		for(int i=0;i<len;i++){
			now=c[now][s[i]-'a'];//向下一层
			for(int t=now;t&&val[t]!=-1;t=fail[t]){//循环求解
				ans+=val[t];
				val[t]=-1;
			}
		}
		return ans;
	}
}ac;
int n;
char buf[N*10];
int main()
{
	scanf("%d",&n);
	for(int i=1;i<=n;i++){
		scanf("%s",buf);
		ac.Insert(buf);
	}
	ac.build();
	scanf("%s",buf);
	printf("%d\n",ac.query(buf));
	return 0;
}

这是一道AC自动机的裸题。

AC自动机(优化后可称Trie图)是一种(可以理解为被过分简化的)有限状态自动机。

所以可以简单的理解为将KMP放在Trie树上。

注意如果每次跳fail边复杂度过高,一次存储完可以进行优化。

这样的AC自动机就成为了Trie图。

不过这题的std是从香港新闻产业来的,加了一个跳转移边的剪枝优化。

对于一个被混淆的二进制文件,capstone进行反汇编,使用状态机识别特定的模式,如 seg000:06428BA7 seg000:06428BA7 53 push ebx seg000:06428BA8 BB B9 FA DF D7 mov ebx, 0D7DFFAB9h seg000:06428BAD 81 F3 F8 33 9B AC xor ebx, 0AC9B33F8h seg000:06428BB3 81 F3 41 C9 44 7B xor ebx, 7B44C941h seg000:06428BB9 89 1B mov [ebx], ebx seg000:06428B50 50 push eax seg000:06428B51 B8 21 3E 7F 88 mov eax, 887F3E21h seg000:06428B56 05 3C EC 43 6D add eax, 6D43EC3Ch seg000:06428B5B 2D CD A6 CD F7 sub eax, 0F7CDA6CDh seg000:06428B60 2D 90 83 F5 FD sub eax, 0FDF58390h seg000:06428B65 89 08 mov [eax], ecx seg000:06428AE5 52 push edx seg000:06428AE6 BA BF C7 EF 9F mov edx, 9FEFC7BFh seg000:06428AEB 81 F2 2B CC DF 5D xor edx, 5DDFCC2Bh seg000:06428AF1 81 EA 5E 69 CF F0 sub edx, 0F0CF695Eh seg000:06428AF7 81 F2 66 55 E4 C2 xor edx, 0C2E45566h seg000:06428AFD 81 C2 B0 08 7B EC add edx, 0EC7B08B0h seg000:06428B03 89 0A mov [edx], ecx seg000:06428A78 57 push edi seg000:06428A79 9C pushf seg000:06428A7A 89 E7 mov edi, esp seg000:06428A7C 01 17 add [edi], edx seg000:06428A7E 9D popf seg000:06428A7F 84 C0 test al, al seg000:06428A81 79 0F jns short near ptr unk_6428A92 seg000:06428AC7 57 push edi seg000:06428AC8 9C pushf seg000:06428AC9 89 E7 mov edi, esp seg000:06428ACB 09 1F or [edi], ebx seg000:06428ACD 9D popf seg000:06428ACE 38 D8 cmp al, bl seg000:06428AD0 7D 05 jge short loc_6428AD7 这几种模式,对于寄存器具有通用性, 跳转条件也具有通用性,对于这几个只需要确认最终指令为最后一个指令形式的即可,capstone每次只反汇编一条指令,将这几种模式的指令可以构造类似AC自动机中的Trie树吗,然后实现状态机进行匹配,实现类似于AC自动机的匹配方式, 不用AC算法。输出匹配到的模式, C++
最新发布
07-22
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值