多字符串匹配-aho-corasick算法

本文介绍了Aho-Corasick自动机的基本原理及构造方法。它作为KMP算法在多模式串匹配上的扩展,通过构建TRIE树并在此基础上构造A-C自动机来实现高效查找。文中还探讨了如何预计算供给函数以提高状态转移效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

aho-corasick自动机
1、图示


 
2、原理:实质是KMP算法在多模式串匹配的扩展,首先构造TRIE树,然后以层次遍历序访问该树,在TRIE树的基础上构造A-C自动机。
其中F(q)表示:
1)q是个终结状态,如果q对应一个完整的字符串,则称q为终结状态
2)F(q)包括了模式串集合P中,q所对应的该集合的子集的字符串
3、构造代码



 
 
基本的算法
二、高级算法
1、对供给函数S的状态转移预先进行计算,对于字母表的每个字符,所有状态都有相应的转移。
2、这种完全的自动机可以由供给函数计算出来,首先,对于字母表中的每个字符σ如果δ(0,σ)=θ,然后按层次遍历的方式访问自动机,设当前状态为current,如果δ(current,σ)=θ,则置δ(current,σ)=δ(SAC(current),σ)
3、不足之处,需要巨大的存储空间
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值