P3808 【模板】AC自动机(简单版)

本文介绍了一道关于AC自动机的编程题,旨在检测算法正确性和常数。文章提供了完整的代码实现,包括字典树的构建、失败指针的设置及查询匹配过程。适用于希望深入了解AC自动机原理及应用的读者。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目背景

通过套取数据而直接“打表”过题者,是作弊行为,发现即棕名。

这是一道简单的AC自动机模板题。

用于检测正确性以及算法常数。

为了防止卡OJ,在保证正确的基础上只有两组数据,请不要恶意提交。

管理员提示:本题数据内有重复的单词,且重复单词应该计算多次,请各位注意

题目描述

给定n个模式串和1个文本串,求有多少个模式串在文本串里出现过。

输入输出格式

输入格式:

 

第一行一个n,表示模式串个数;

下面n行每行一个模式串;

下面一行一个文本串。

 

输出格式:

 

一个数表示答案

 

输入输出样例

输入样例#1: 复制

2
a
aa
aa

输出样例#1: 复制

2

说明

subtask1[50pts]:∑length(模式串)<=10^6,length(文本串)<=10^6,n=1;

subtask2[50pts]:∑length(模式串)<=10^6,length(文本串)<=10^6;

代码如下

#include <iostream>
#include <queue>
#define maxn 1000005
#define MAX 26
using namespace std;
struct AC{
    int e;   //以这个节点为结尾的模式串有几个 
    int next[MAX];
    int fail;
}tree[maxn];
const int root = 0;
int cnt = 0;
void build(string str)  //建立字典树 
{
    int now = root;
    for(int i = 0; i < str.size(); i ++){
        if(!tree[now].next[str[i] - 'a'])
            tree[now].next[str[i] - 'a'] = ++cnt;
        now = tree[now].next[str[i] - 'a'];
        if(i == str.size() - 1)
            tree[now].e ++;
    }
}
void get_fail()   //将trie树补全成trie图 
{
    queue<int> que;
    for(int i = 0; i < MAX; i ++){
        if(tree[0].next[i]){
            tree[tree[0].next[i]].fail = 0;
            que.push(tree[0].next[i]);
        }
    }
    while(!que.empty()){
        int now = que.front();
        que.pop();
        for(int i = 0; i < MAX; i ++){
            if(tree[now].next[i]){
                tree[tree[now].next[i]].fail = tree[tree[now].fail].next[i];
                que.push(tree[now].next[i]);
            }
            else
                tree[now].next[i] = tree[tree[now].fail].next[i];
        }
    }
}
int ac_query(string str) //匹配 
{
    int now = root;
    int ans = 0;
    for(int i = 0; i < str.size(); i ++){
        now = tree[now].next[str[i] - 'a'];
        int u = now;
        while(u && tree[u].e != -1){
            ans += tree[u].e;
            tree[u].e = -1;
            u = tree[u].fail;
        }
    }
    return ans;
}
int main()
{
    std::ios::sync_with_stdio(false);
    int n;
    cin >> n;
    for(int i = 0; i < n; i ++){
        string str;
        cin >> str;
        build(str);
    }
    get_fail();
    string s;
    cin >> s;
    cout << ac_query(s) << endl;
    return 0;
}

 

### C++ 实现 AC 自动机 (Aho-Corasick Algorithm) #### 构建字典树 为了构建 Aho-Corasick 字典树,首先需要定义节点结构体 `Node` 和初始化根节点: ```cpp struct Node { int next[26]; // 子节点指针数组 bool is_end; // 是否为模式串结尾标志位 int fail; // 失败指针 Node() : is_end(false), fail(-1) { memset(next, -1, sizeof(next)); } }; vector<Node> trie(1); // 使用动态数组存储 Trie 节点,0 号位置作为根节点 ``` #### 插入操作 通过递归方式向字典树中插入字符串: ```cpp void insert(const string& pattern) { int node_id = 0; for (char ch : pattern) { int idx = ch - 'a'; if (trie[node_id].next[idx] == -1) { trie.push_back(Node()); trie[node_id].next[idx] = trie.size() - 1; } node_id = trie[node_id].next[idx]; } trie[node_id].is_end = true; } ``` #### 建立失败指针 利用广度优先遍历建立各节点的失败指针关系: ```cpp queue<int> q; for(int i=0;i<26;++i){ if(trie[0].next[i]!=-1){ q.push(trie[0].next[i]); } } while (!q.empty()) { int curr_node = q.front(); q.pop(); for (int c = 0; c < 26; ++c) { if (trie[curr_node].next[c] != -1) { int fail_ptr = trie[curr_node].fail; while(fail_ptr!=-1 && trie[fail_ptr].next[c]==-1){ fail_ptr = trie[fail_ptr].fail; } if (trie[fail_ptr].next[c] != -1) trie[trie[curr_node].next[c]].fail = trie[fail_ptr].next[c]; else trie[trie[curr_node].next[c]].fail = 0; q.push(trie[curr_node].next[c]); }else{ int fail_ptr = trie[curr_node].fail; while(fail_ptr!=-1 && trie[fail_ptr].next[c]==-1){ fail_ptr = trie[fail_ptr].fail; } if (trie[fail_ptr].next[c] != -1) trie[curr_node].next[c]=trie[fail_ptr].next[c]; } } } ``` #### 模式匹配过程 完成上述准备工作之后,在给定文本上执行多模匹配算法: ```cpp vector<string> patterns{"he", "she", "his", "hers"}; string text = "ahishers"; // 初始化并加载所有模式串到Trie中 for(auto &p:patterns){ insert(p); } build_fail(); int current_state = 0; for(char t:text){ int index=t-'a'; while(current_state!=0&&trie[current_state].next[index]==-1){ current_state=trie[current_state].fail; } if(trie[current_state].next[index]!=-1){ current_state=trie[current_state].next[index]; if(trie[current_state].is_end){ cout << "Pattern found at position:" << endl; } int temp=current_state; while(temp){ if(trie[temp].is_end){ cout<<temp<<" "; } temp=trie[temp].fail; } } } ``` 此代码实现了完整的 Aho-Corasick 算法流程[^3]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值