AC自动机(简单版)--P3808 【模板】

博客围绕一个问题展开,即给出n个模式串和一个文本串,求文本串中出现的模式串数量。这是AC自动机裸题,作者看过多个版本的AC自动机后理解了代码实现,也体会到懂原理与用原理解决问题间的差距。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题意:给出n个模式串和一个文本串,问在文本串中出现了几个模式串。

思路:AC自动机裸题;

看过n个版本的AC自动机后终于理解了代码是如何实现的。再一次体会到光懂得原理和能利用原理解决问题之间的巨大的鸿沟。

代码:

#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
#include <vector>
#include <queue>
#define INF 0x3f3f3f3f
#define FRE() freopen("in.txt","r",stdin)
using namespace std;
const int maxn = 1e6+10;
typedef long long ll;
typedef pair<int,int> P;
int cnt = 0;
struct AC
{
    int next[26];
    int en,fail;
}ac[maxn];

void Build(char* str)//建字典树
{
    int rt = 0;
    for(int i = 0; str[i]; i++)
    {
        int index = str[i] - 'a';
        if(!ac[rt].next[index])
            ac[rt].next[index] = ++cnt;
        rt = ac[rt].next[index];
    }
    ac[rt].en++;
}

void getFail()//获取fail指针
{
    queue<int> que;
    for(int i = 0; i < 26; i++)
    {
        if(ac[0].next[i])
        {
            ac[ac[0].next[i]].fail = 0;//将根节点孩子的fail指针指向根,即0
            que.push(ac[0].next[i]);
        }
    }
    while(!que.empty())
    {
        int now = que.front(); que.pop();
        for(int i = 0; i < 26; i++)
        {
            if(!ac[now].next[i])//如果该节点孩子没有出现过,就将这个节点的孩子等于该节点fail指向的节点的孩子
                ac[now].next[i] = ac[ac[now].fail].next[i];
            else//出现过就将这个节点孩子的fail指向这个节点的fail指向的节点的孩子
            {
                ac[ac[now].next[i]].fail = ac[ac[now].fail].next[i];
                que.push(ac[now].next[i]);
            }
        }
    }
}

int Fun(char* str)
{
    int rt = 0,res = 0;
    for(int i = 0; str[i]; i++)
    {
        rt = ac[rt].next[str[i]-'a'];
        for(int j = rt; j&&ac[j].en!=-1; j= ac[j].fail)
        {
            res += ac[j].en;
            ac[j].en = -1;
        }
    }
    return res;
}

char buf[maxn];
int main()
{

    int t;
    scanf("%d",&t);
    while(t--)
    {
        scanf("%s",buf);
        Build(buf);
    }
    getFail();
    scanf("%s",buf);
    printf("%d\n",Fun(buf));
    return 0;
}

 

### C++ 实现 AC 自动机 (Aho-Corasick Algorithm) #### 构建字典树 为了构建 Aho-Corasick 字典树,首先需要定义节点结构体 `Node` 和初始化根节点: ```cpp struct Node { int next[26]; // 子节点指针数组 bool is_end; // 是否为模式串结尾标志位 int fail; // 失败指针 Node() : is_end(false), fail(-1) { memset(next, -1, sizeof(next)); } }; vector<Node> trie(1); // 使用动态数组存储 Trie 节点,0 号位置作为根节点 ``` #### 插入操作 通过递归方式向字典树中插入字符串: ```cpp void insert(const string& pattern) { int node_id = 0; for (char ch : pattern) { int idx = ch - 'a'; if (trie[node_id].next[idx] == -1) { trie.push_back(Node()); trie[node_id].next[idx] = trie.size() - 1; } node_id = trie[node_id].next[idx]; } trie[node_id].is_end = true; } ``` #### 建立失败指针 利用广度优先遍历建立各节点的失败指针关系: ```cpp queue<int> q; for(int i=0;i<26;++i){ if(trie[0].next[i]!=-1){ q.push(trie[0].next[i]); } } while (!q.empty()) { int curr_node = q.front(); q.pop(); for (int c = 0; c < 26; ++c) { if (trie[curr_node].next[c] != -1) { int fail_ptr = trie[curr_node].fail; while(fail_ptr!=-1 && trie[fail_ptr].next[c]==-1){ fail_ptr = trie[fail_ptr].fail; } if (trie[fail_ptr].next[c] != -1) trie[trie[curr_node].next[c]].fail = trie[fail_ptr].next[c]; else trie[trie[curr_node].next[c]].fail = 0; q.push(trie[curr_node].next[c]); }else{ int fail_ptr = trie[curr_node].fail; while(fail_ptr!=-1 && trie[fail_ptr].next[c]==-1){ fail_ptr = trie[fail_ptr].fail; } if (trie[fail_ptr].next[c] != -1) trie[curr_node].next[c]=trie[fail_ptr].next[c]; } } } ``` #### 模式匹配过程 完成上述准备工作之后,在给定文本上执行多模匹配算法: ```cpp vector<string> patterns{"he", "she", "his", "hers"}; string text = "ahishers"; // 初始化并加载所有模式串到Trie中 for(auto &p:patterns){ insert(p); } build_fail(); int current_state = 0; for(char t:text){ int index=t-'a'; while(current_state!=0&&trie[current_state].next[index]==-1){ current_state=trie[current_state].fail; } if(trie[current_state].next[index]!=-1){ current_state=trie[current_state].next[index]; if(trie[current_state].is_end){ cout << "Pattern found at position:" << endl; } int temp=current_state; while(temp){ if(trie[temp].is_end){ cout<<temp<<" "; } temp=trie[temp].fail; } } } ``` 此代码实现了完整的 Aho-Corasick 算法流程[^3]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值