前言
下文的代码有些部分参考了这篇文章,但我仍然坚持作为原创而非转载,自有我的考虑。
在看下文之前,需要理解的基础知识有KMP算法原理和字典树数据结构理解。了解了上述内容就可以开始之后的旅程了。
原理简析
AC自动机相比于字典树结构仅仅是多了fail结点,指向其已匹配成功的前缀。其模式匹配与KMP算法一致。
引用百度百科的图片,即sh后匹配e失败,此时h其实是已经匹配成功的状态,所以可以从74这个匹配成功h的结点之后继续匹配下一字符。
代码实现
python3的具体实现
# -*- coding:utf-8 -*-
"""
Description: AC自动机
@author: WangLeAi
@date: 2018/8/19
"""
from collections import defaultdict
class TrieNode(object):
def __init__(self, value=None):
# 值
self.value = value
# fail指针
self.fail = None
# 尾标志:标志为i表示第i个模式串串尾,默认为0
self.tail = 0
# 子节点,{value:TrieNode}
self.children = {
}
class Trie(object):
def __init__(self, words):
print("初始化")
# 根节点
self.root = TrieNode()
# 模式串个数