ZOJ 3228 Searching the String(AC自动机)

本文介绍使用AC自动机解决在一个长串中查找多个模式串的可重叠和不可重叠最大重复次数的问题,通过建立AC自动机并利用贪心策略确定不重叠的最大重复次数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目链接:http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemCode=3228

解题思路:

给出一个长串,询问很多个模式串在这个长串中可重叠最大重复次数以及不可重叠最大重复次数。

首先KMP虽然处理可重叠和不可重叠很方便(不可重叠的情况完全匹配后j指针归0即可),但是无奈长串太长,模式串太多,所以肯定会T成狗

那么还是用AC自动机做吧。

关键思路:

建好AC自动机后,如何在长串跑自动机的时候求出每种串不可重叠的最大重复次数?

我们开两个数组,一个记录当前串的长度,另一个记录上一次出现这个串的末尾在长串的哪个位置,于是再次匹配到这个串是,根据长串两次的节点差判断是不是有相交即可,如果没重叠,那么需要更新这个串上一次出现的位置为现在的位置

不会证明为什么类似贪心的“能取则取”,就能求出不重叠的最大重复次数,但是举不出放弃取第一段,而去取重叠的第二段会使得接下来不重叠的次数变多的例子。

既然都AC了那应该就可以这样做,是的,就是这样子!

补充说明一些具体的操作:

对于每次询问我们把要询问的串插入(不重复),给每个插入的不同的串编个号,记录每次询问的单词的编号这样等会儿一次匹配处理好之后,每个询问就能根据编号找到答案了。

代码:

#include<cstdio>
#include<cstring>
#include<iostream>
#include<queue>
#include<set>
#include<map>
#include<algorithm>

using namespace std;

#define ll long long
#define ull unsigned long long
#define for1(i,a,b) for (int i=a;i<=b;i++)
#define for0(i,a,b) for (int i=a;i<b;i++)
#define rof1(i,a,b) for (int i=a;i>=b;i--)
#define rof0(i,a,b) for (int i=a;i>b;i--)
#define pb push_back
#define fi first
#define se second
#define debug(x) printf("----Line %s----\n",#x)
#define pt(x,y) printf("%s = %d\n",#x,y)
#define INF 0x3f3f3f3f
#define dfl(x) ll x;scanf("%I64d",&x)
#define df2l(x,y) ll x,y;scanf("%I64d %I64d",&x,&y)
#define df(x) int x;scanf("%d",&x);
#define df2(x,y) int x,y;scanf("%d %d",&x,&y)
#define mod 1000000007
#define duozu(T) int T;scanf("%d",&T);while (T--)

const int N = 1e5+5;

const int maxnode = 6e5+5;//模式串数量*长度
const int ALP = 26;//字符种类数
char s[N],ss[10];

struct AC_am
{
    queue<int>que;
    int sz;
    int trie[maxnode][ALP];
    int fail[maxnode];
    int last[maxnode];
    int val[maxnode];//储存当前节点信息,如是否为单词节点等等
    int tot;
    int ans1[N],ans2[N];///可以重叠,不可以重叠
    int pos[N],len[N];///记录每个串上一次出现的位置,这种串的长度

    int newnode(int x){
        memset(trie[x],0,sizeof trie[x]);
        val[x] = 0;
        return sz++;
    }

    void init(){
        tot = 1;
        memset(ans1,0,sizeof ans1);
        memset(ans2,0,sizeof ans2);
        memset(pos,-INF,sizeof pos);
        newnode(sz = 0);
    }

    int idx(char ch){//实际字符串转化为字典树对应节点,根据题目做出具体改变
        return ch-'a';
    }

    int insert(char *s){
        int u = 0;
        for (int i=0;s[i];i++){
            int c = idx(s[i]);
            if (!trie[u][c]){
                trie[u][c] = newnode(sz);
            }
            u = trie[u][c];
        }
        if (!val[u]){
            val[u] = tot++;
            len[val[u]] = strlen(s);
        }
        return val[u];
    }

    void build(){
        fail[0] = 0;
        for (int c=0;c<ALP;c++){
            int v = trie[0][c];
            if (v){
                que.push(v);
                fail[v] = 0;
                last[v] = 0;
            }
        }
        while (!que.empty()){
            int u = que.front();que.pop();
            for (int c=0;c<ALP;c++){
                int v = trie[u][c];
                if (!v){
                    trie[u][c] = trie[fail[u]][c];
                    continue;
                }
                fail[v] = trie[fail[u]][c];
                last[v] = val[fail[v]]? fail[v]:last[fail[v]];
                que.push(v);
            }
        }
    }

    void count(int x,int now){
        while(x){
            ans1[val[x]]++;
            if (pos[val[x]]+len[val[x]]-1<now) ans2[val[x]]++,pos[val[x]] = now;
            x = last[x];
        }
    }

    void find(char *s){
        int u = 0;
        for (int i=0;s[i];i++){
            int c = idx(s[i]);
            u = trie[u][c];
            if (val[u]) count(u,i);
            else if (last[u]) count(last[u],i);
        }
    }

}ac;

pair<int,int>q[N];///fi:串的id,se:提问类型:串是否可重叠

int main()
{
    //freopen("C:/Users/DELL/Desktop/input.txt", "r", stdin);
    //freopen("C:/Users/DELL/Desktop/output.txt", "w", stdout);
    int ica=1,qq,op;
    while (~scanf("%s",s)){
        scanf("%d",&qq);
        ac.init();
        for0(i,0,qq) scanf("%d %s",&op,ss),q[i].fi = ac.insert(ss),q[i].se = op;
        ac.build();
        ac.find(s);
        printf("Case %d\n",ica++);
        for0(i,0,qq){
            int id = q[i].fi;
            if (q[i].se==0) printf("%d\n",ac.ans1[id]);
            else printf("%d\n",ac.ans2[id]);
        }
        puts("");
    }
    return 0;
}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值