UVA 11019 Matrix Matcher(AC自动机:矩阵匹配)

本文介绍了一种使用AC自动机解决矩阵匹配问题的方法,通过构建AC自动机来高效查找小矩阵在大矩阵中的所有出现位置。特别地,文章详细解释了如何处理重复的小矩阵行,并给出了完整的C++实现代码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

UVA 11019 Matrix Matcher(AC自动机:矩阵匹配)

题意:给你一个大字符矩阵n*m的,然后在给你一个小字符矩阵x*y的,现在问你在这个大矩阵中有多少个小矩阵的匹配点?

分析:详解请见刘汝佳:训练指南P218及其源代码.

       大致思想如下,具体看源代码实现:

       我们用小矩阵的每一行做一个模式串,然后小矩阵有x行(其实这里不一定有x行,后面会说)就用这x行字符建立一个AC自动机.

我们设c[i][j]=k表示以大矩阵的格子(i,j)为左上角的x*y矩阵与原小矩阵有k行对应完全相同.则我们知道如果c[i][j]==x,那么该点就是一个匹配点.

然后我们一行一行的用大矩阵的一行去匹配AC自动机,假设当前匹配大矩阵的第k行,那么如果此时第k行的第i个字符与单词节点即小矩阵的某一行(假设为j行)匹配成功(即大矩阵的第k行第i个字符对应小矩阵的第j行最后一个字符),那么c[k-j][i-y+1]++.(仔细想想是不是)

       上面说到插入AC自动机的行数不一定为x,因为某些小矩阵的行可能完全相同,所以这个时候就要把完全相同的小矩阵用一个带头结点的链表链起来了.具体代码中用repr表示头结点,next表示链接.

AC代码:

#include<cstdio>
#include<cstring>
#include<queue>
using namespace std;
const int maxnode=10000+100;
const int sigma_size=26;

void process_match(int pos,int v);
struct AC_Automata
{
    int ch[maxnode][sigma_size];
    int val[maxnode];//保存的是单词节点的链表 序号
    int f[maxnode];
    int last[maxnode];
    int sz;
    void init()
    {
        sz=1;
        memset(ch[0],0,sizeof(ch[0]));
        val[0]=f[0]=last[0]=0;
    }
    void insert(char *s,int v)
    {
        int n=strlen(s),u=0;
        for(int i=0;i<n;i++)
        {
            int id=s[i]-'a';
            if(ch[u][id]==0)
            {
                ch[u][id]=sz;
                memset(ch[sz],0,sizeof(ch[sz]));
                val[sz++]=0;
            }
            u=ch[u][id];
        }
        val[u]=v;
    }
    void print(int i,int j)
    {
        if(val[j])
        {
            process_match(i,val[j]);
            print(i,last[j]);
        }
    }
    void find(char *s)
    {
        int n=strlen(s),j=0;
        for(int i=0;i<n;i++)
        {
            int id=s[i]-'a';
            while(j && ch[j][id]==0) j=f[j];
            j=ch[j][id];
            if(val[j]) print(i,j);
            else if(last[j]) print(i,last[j]);
        }
    }
    void getFail()
    {
        queue<int> q;
        f[0]=0;
        for(int i=0;i<sigma_size;i++)
        {
            int u=ch[0][i];
            if(u)
            {
                f[u]=last[u]=0;
                q.push(u);
            }
        }
        while(!q.empty())
        {
            int r=q.front();q.pop();
            for(int i=0;i<sigma_size;i++)
            {
                int u=ch[r][i];
                if(!u) continue;
                q.push(u);
                int v=f[r];
                while(v && ch[v][i]==0) v=f[v];
                f[u]=ch[v][i];
                last[u]= val[f[u]]?f[u]:last[f[u]];
            }
        }
    }
};
AC_Automata ac;
const int maxn=1000+10;
const int maxm=1000+10;
const int maxx=100+10;
const int maxy=100+10;
int repr[maxx];
int next[maxx];
int len[maxx];
char text[maxn][maxm],p[maxx][maxy];
int tr;//当前扫描行数
int cnt[maxn][maxm];
void process_match(int pos,int v)
{
    int pr= repr[v-1];
    int c=pos-len[pr]+1;
    while(pr>=0 )
    {
        if(tr>=pr) cnt[tr-pr][c]++;
        pr=next[pr];
    }
}
int main()
{
    int T,x,y,n,m;
    scanf("%d",&T);
    while(T--)
    {
        scanf("%d%d",&n,&m);
        for(int i=0;i<n;i++)
            scanf("%s",text[i]);
        scanf("%d%d",&x,&y);
        for(int i=0;i<x;i++)
            scanf("%s",p[i]);
        ac.init();
        for(int i=0;i<x;i++)
        {
            repr[i]=i;
            next[i]=-1;
            len[i]=strlen(p[i]);
            for(int j=0;j<i;j++)
                if(strcmp(p[i],p[j])==0)
                {
                    repr[i]=j;
                    next[i]=next[j];
                    next[j]=i;
                    break;
                }
            if(repr[i]==i) ac.insert(p[i],i+1);
        }
        ac.getFail();
        memset(cnt,0,sizeof(cnt));
        for(tr=0;tr<n;tr++)
            ac.find(text[tr]);
        int ans=0;

        for(int i=0;i<n-x+1;i++)
            for(int j=0;j<m-y+1;j++)
                if(cnt[i][j]==x)
                    ans++;
        printf("%d\n",ans);
    }
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值