洛谷 P3763 [TJOI2017]DNA 后缀数组

本文深入探讨了一种高效的字符串匹配算法,特别关注于如何通过构建后缀数组和高度数组来快速找出两个字符串之间的最长匹配前缀,进而解决合法子串数量的计算问题。文章详细介绍了算法的实现过程,包括后缀数组的生成、高度数组的构建以及如何利用这些数据结构进行快速匹配。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目大意:
给定两个串AAABBB。如果AAA的一个子串与BBB相差不超过333个字符,那么就是合法的。
求合法子串数。
lenA,lenB≤105len_{A},len_B≤10^5lenA,lenB105

分析:
考虑从AAA串的第iii为匹配,找到一个最长的前缀与BBB匹配,然后跳过这一位,继续匹配下去。
如果跳过字符超过333个,就是不合法的。
可以把BBB串加入到AAA串后面跑后缀数组,就可以快速求出最长匹配的位置。

代码:

// luogu-judger-enable-o2
#include <iostream>
#include <cstdio>
#include <cmath>
#include <cstring>

const int maxn=2e5+7;

using namespace std;

int T,n,m,len,ans;
int x[maxn],y[maxn],c[maxn],lg[maxn];
char s[maxn],s1[maxn];

struct suffle_array{
    int rank[maxn],sa[maxn],h[maxn][20];
    void getsa()
    {
        memset(x,0,sizeof(x));
        memset(y,0,sizeof(y));
        memset(c,0,sizeof(c));
        memset(rank,0,sizeof(rank));
        memset(sa,0,sizeof(sa));
        memset(h,0,sizeof(h));
        int n=len,m=1000;
        for (int i=1;i<=m;i++) c[i]=0;
        for (int i=1;i<=n;i++) x[i]=s[i];
        for (int i=1;i<=n;i++) c[x[i]]++;
        for (int i=1;i<=m;i++) c[i]+=c[i-1];
        for (int i=n;i>0;i--) sa[c[x[i]]--]=i;
        for (int k=1;k<=n;k<<=1)
        {
            int num=0;
            for (int i=n-k+1;i<=n;i++) y[++num]=i;
            for (int i=1;i<=n;i++) if (sa[i]>k) y[++num]=sa[i]-k;
            for (int i=1;i<=m;i++) c[i]=0;
            for (int i=1;i<=n;i++) c[x[i]]++;
            for (int i=1;i<=m;i++) c[i]+=c[i-1];
            for (int i=n;i>0;i--) sa[c[x[y[i]]]--]=y[i],y[i]=0;
            swap(x,y);
            num=1;
            x[sa[1]]=1;
            for (int i=2;i<=n;i++)
            {
                if ((y[sa[i]]!=y[sa[i-1]]) || (y[sa[i]+k]!=y[sa[i-1]+k]))
                {
                    x[sa[i]]=++num;
                }
                else x[sa[i]]=num;
            }
            if (num>=n) break;
            m=num;
        }
        for (int i=1;i<=n;i++) rank[i]=x[i];
    }
    void getheight()
    {
        int n=len,k=0;		
        for (int i=1;i<=n;i++)
        {
            if (k) k--;
            int j=sa[rank[i]-1];
            while ((i+k<=n) && (j+k<=n) && (s[i+k]==s[j+k])) k++;
            h[rank[i]][0]=k;
        }
        int c=1;
        for (int j=1;j<20;j++)
        {
            for (int i=1;i+2*c-1<=n;i++) h[i][j]=min(h[i][j-1],h[i+c][j-1]);
            c<<=1;
        }
    }
    int lcp(int x,int y)
    {
        x=rank[x],y=rank[y];
        if (x>y) swap(x,y);
        x++;
        int c=lg[y-x+1];
        return min(h[x][c],h[y-(1<<c)+1][c]);
    }
}A;

int main()
{
    for (int i=1;i<=2e5;i++) lg[i]=trunc(log(i+0.5)/log(2));	
    scanf("%d",&T);
    while (T--)
    {
        scanf("%s",s+1);
        n=strlen(s+1);
        scanf("%s",s1+1);
        m=strlen(s1+1);
        s[n+1]=' ';
        for (int i=1;i<=m;i++) s[n+1+i]=s1[i];		
        len=n+m+1;
        A.getsa(),A.getheight();
        ans=0;		
        for (int i=1;i<=n-m+1;i++)
        {
            int num=0,flag=0;					
            while ((flag<=3) && (num<m))
            {
                num+=A.lcp(i+num,n+2+num);
                if (num>=m) break;
                flag++,num++;
            }
            if (flag<=3) ans++;
        }
        printf("%d\n",ans);
    }
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值