[GDKOI2014][JZOJ3572]基因模式

本文介绍了一种利用后缀自动机解决特定子串匹配问题的方法,针对含有特定字符奇偶性限制的字符串,高效计算满足条件的子串数量。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目大意

给定一个模板串T,字符集为{A,C,T,G}
q个询问,每次给出一个串S,字符集也只是上面四个字母,还会给定字符集中某些字母的奇偶性限制,询问S中一共有多少个子串满足以下两个条件:
 这个串是T的一个子串
 对于给定了奇偶性限制的字母,该串中中该字母出现的次数奇偶性要满足这个限制

1|T|105,|S|105,q103


题目分析

T串构造后缀自动机,然后拿询问串在上面跑。
对于询问串的一个位置i假设我们在SAM上匹配到了节点p,任选rightp中的任意一个节点作为右端点r,可能的答案串左端点在区间[rmatchlen+1,r]内,现在我们要满足奇偶性限制。
既然字符集大小为4,考虑使用4位二进制状态来表示每个字符出现次数的奇偶性,我们处理一下前缀和减一减就可以得到i对答案的贡献。
时间复杂度O(|T|+2|Σ||S|)


代码实现

#include <iostream>
#include <cstring>
#include <cstdio>

using namespace std;

typedef long long LL;

const int N=100050;
const int W=4;
const int S=1<<W;
const int V=N<<1;

int sum[N][S],pre[N];
int pur,cor;

namespace SAM
{
    struct node
    {
        int prt,len,pos;
        int nxt[W];
    }sam[V];

    int tot,root;

    int newnode()
    {
        ++tot,memset(sam[tot].nxt,0,sizeof sam[tot].nxt),sam[tot].prt=sam[tot].len=sam[tot].pos=0;
        return tot;
    }

    void init(){tot=0,root=newnode();}

    int insert(int lst,int c,int ps)
    {
        int np=newnode(),p=lst,q;
        for (sam[np].len=sam[p].len+1,sam[np].pos=ps;p&&!sam[p].nxt[c];p=sam[p].prt) sam[p].nxt[c]=np;
        if (!p) sam[np].prt=root;
        else if (sam[q=sam[p].nxt[c]].len==sam[p].len+1) sam[np].prt=q;
        else
        {
            int nq=newnode();
            sam[nq]=sam[q],sam[np].prt=sam[q].prt=nq;
            for (sam[nq].len=sam[p].len+1;p&&sam[p].nxt[c]==q;p=sam[p].prt) sam[p].nxt[c]=nq;
        }
        return np;
    }

    int match(int &p,int c,int &len)
    {
        int ret=0;
        for (;p&&!sam[p].nxt[c];p=sam[p].prt,len=sam[p].len);
        p=p?p:root;
        if (sam[p].nxt[c]) p=sam[p].nxt[c],++len;
        for (int s=0,r=sam[p].pos,l=r-len;s<S;++s)
            if (!((s^pur)&cor)) ret+=(r?sum[r-1][pre[r]^s]:(pre[r]^s?0:1))-(l-1>=0?sum[l-1][pre[r]^s]:(pre[r]^s?0:(!l?1:0)));
        return ret;
    }
};

char T[N],str[N],L[10];
int id[26];
int n,m,q;

int main()
{
    id[0]=0,id[2]=1,id[19]=2,id[6]=3;
    freopen("pattern.in","r",stdin),freopen("pattern.out","w",stdout);
    scanf("%d",&q),scanf("%s",T),n=strlen(T),SAM::init();
    sum[0][0]=1;
    for (int i=0,lst=SAM::root;i<n;++i)
    {
        lst=SAM::insert(lst,id[T[i]-'A'],i);
        if (i) for (int s=0;s<S;++s) sum[i][s]=sum[i-1][s];
        ++sum[i][pre[i]=(i?pre[i-1]:0)^(1<<id[T[i]-'A'])];
    }
    for (LL ans;q--;printf("%lld\n",ans))
    {
        scanf("%s",str),m=strlen(str);
        scanf("%s",L),pur=cor=0;
        for (int i=0;L[i]!='\0';++i)
            if ('A'<=L[i]&&L[i]<='Z') pur|=1<<id[L[i]-'A'],cor|=1<<id[L[i]-'A'];
            else cor|=1<<id[L[i]-'a'];
        ans=0;
        for (int i=0,lst=SAM::root,l=0;i<m;++i) ans+=SAM::match(lst,id[str[i]-'A'],l);
    }
    fclose(stdin),fclose(stdout);
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值