UVA 11019 Matrix Matcher(AC自动机)

本文介绍了一种基于Tire和AC自动机的文本匹配算法,该算法用于在一个大的文本矩阵中查找特定模式串出现的次数。通过构建Tire树并利用AC自动机进行搜索,能够高效地解决重复模式匹配的问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题意:给一个n*m的文本串和x*y的模式串,问模式串出现几次。


思路:对模式串每一行建立Tire,设c[i][j]代表模式串p左上角在(i,j)位置上时有模式串多少行可以与文本串匹配,在文本串中每一行用AC自动机寻找,注意可能有模式串重复的情况,要用一个nxt数组,连接起所有的重复的模式串,tire上的值即为模式串的行号


#include<cstdio>
#include<cstring>
#include<queue>
#include<algorithm>
const int maxn = 1e3 + 10;
const int maxSize = 30;
using namespace std;

char t[maxn][maxn], p[110][110];
int f[maxn*maxn], last[maxn*maxn], np;
int ch[20500][maxSize], sz;
int val[maxn*maxn], c[maxn][maxn];
int l[maxn], nxt[maxn];
int have[maxn], L[maxn];

void init() {
    sz = 1;
    memset(ch[0], 0, sizeof(ch[0]));
    memset(val, 0, sizeof(val));
    memset(f, 0, sizeof(f));
    memset(c, 0, sizeof c);
    memset(nxt, -1, sizeof nxt);
    memset(have, 0, sizeof(have));
}

void build(char *s, int ii) {
    int u = 0, n = strlen(s);
    for(int i = 0; i < n; i++) {
        int c = s[i] - 'a' + 1;
        if(!ch[u][c]) {
            memset(ch[sz], 0, sizeof(ch[sz]));
            ch[u][c] = sz++;
        }
        u = ch[u][c];
    }
    val[u] = ii;
}

void print(int i, int j, int R) {
    if(!j) return ;
    int ind = val[j] - 1;
    while(ind != -1) {
        if(R - ind >= 0) c[R - ind][i - L[ind] + 1]++;
        ind = nxt[ind];
    }
    print(i, last[j], R);
}

void getfail() {
    queue<int> q;
    f[0] = 0;
    for(int c = 0; c < maxSize; c++) {
        int u = ch[0][c];
        if(u) { f[u] = 0; q.push(u); last[u] = 0; }
    }
    while(!q.empty()) {
        int r = q.front(); q.pop();
        for(int c = 0; c < maxSize; c++) {
            int u = ch[r][c];
            if(!u) continue;
            q.push(u);
            int v = f[r];
            while(v && !ch[v][c]) v = f[v];
            f[u] = ch[v][c];
            last[u] = val[f[u]] ? f[u] : last[f[u]];
        }
    }
}

void Find(char *T, int R) {
    int n = l[R], j = 0;
    for(int i = 0; i < n; i++) {
        int c = T[i] - 'a' + 1;
        while(j && !ch[j][c]) j = f[j];
        j = ch[j][c];
        if(val[j]) print(i, j, R);
        else if(last[j]) print(i, last[j], R);
    }
}

int main() {
    int n, m, x, y, T;
    scanf("%d", &T);
    while(T--) {
        init();
        scanf("%d %d", &n, &m);
        for(int i = 0; i < n; i++) {
            scanf("%s", t[i]);
            l[i] = m;
        }
        scanf("%d %d", &x, &y);
        for(int i = 0; i < x; i++) {
            scanf("%s", p[i]);
            L[i] = y;
        }
        for(int i = 0; i < x; i++) {
            for(int j = i + 1; j < x; j++) {
                if(strcmp(p[i], p[j])) continue;
                nxt[i] = j; have[j] = 1;
                break;
            }
        }
        for(int i = 0; i < x; i++) {
            if(have[i]) continue;
            build(p[i], i + 1);
        }
        getfail();
        for(int i = 0; i < n; i++)
            Find(t[i], i);
        int ans = 0;
        for(int i = 0; i < n; i++) {
            for(int j = 0; j < m; j++)
                if(c[i][j] == x) ans++;
        }
        printf("%d\n", ans);
    }
    return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值