[bzoj4503]两个串

最新推荐文章于 2018-12-26 15:36:00 发布

原创最新推荐文章于 2018-12-26 15:36:00 发布 · 965 阅读

0 ·

CC 4.0 BY-SA版权

FFT 专栏收录该内容

6 篇文章

订阅专栏

本文介绍了一种利用快速傅立叶变换（FFT）进行高效字符串匹配的方法，特别适用于包含通配符的情况。通过将字母映射为数值，并巧妙地设计数学公式，可以有效地计算两个字符串之间的匹配度。

4503: 两个串

Time Limit: 20 Sec Memory Limit: 256 MB
Submit: 190 Solved: 106
[Submit][Status][Discuss]
Description

兔子们在玩两个串的游戏。给定两个字符串S和T，兔子们想知道T在S中出现了几次，
分别在哪些位置出现。注意T中可能有“?”字符，这个字符可以匹配任何字符。
Input

两行两个字符串，分别代表S和T
Output

第一行一个正整数k，表示T在S中出现了几次
接下来k行正整数，分别代表T每次在S中出现的开始位置。按照从小到大的顺序输出，S下标从0开始。
Sample Input

ababcadaca

a?a
Sample Output

5
HINT

S 长度不超过 10^5， T 长度不会超过 S。 S 中只包含小写字母， T中只包含小写字母和“?”

这道题还是非常神的！！
可以设这样一个函数（假设现在没有通配符）
$f[x]=\sum_{i=1}^{n}(s1[i]-s2[i])^2$
如果这两个字符串相同，那么函数值肯定等于 $0$ 。
如果有了通配符，那么就需要想办法让这个函数还等于 $0$ 。
我们将a~z用1~26表示，”?”设为0。这样就可以构造一个新的函数：
$f[x]=\sum_{i=1}^{n}(s1[i]-s2[i])^2*s2[i]$
$\ \ \ \ \ \ =\sum_{i=1}^{n}s1[i]^2*s2[i]-\sum_{i=1}^{n}2*s1[i]*s2[i]^2+\sum_{i=1}^{n}s2[i]^3$
只要把第二个字符串倒过来，就成了一个卷积的形式，直接 $FFT$ 就行了。

#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
using namespace std;
const int M=100010;
const int O=2000000;
int s[2][M],l[2],L,N,rev[O],dig[O];
struct S{
    double x,y;
    S operator + (const S &xx){return (S){x+xx.x,y+xx.y};}
    S operator - (const S &xx){return (S){x-xx.x,y-xx.y};}
    S operator * (const S &xx){return (S){x*xx.x-y*xx.y,x*xx.y+y*xx.x};}
}a[O],b[O],c[O],d[O];
inline double Pow(int x){
    return (double)x*x;
}
inline double POW(int x){
    return (double)x*x*x;
}
inline void FFT(S *a,int f){
    int i,j,k;
    S wn,w,x,y;
    for(i=0;i<N;++i) d[i]=a[rev[i]];
    for(i=0;i<N;++i) a[i]=d[i];
    for(i=1;i<=N;i<<=1){
        wn=(S){cos(2*M_PI/i),f*sin(2*M_PI/i)};
        for(j=0;j<N;j+=i){
            w=(S){1.,0.};
            for(k=j;k<j+i/2;++k){
                x=a[k];
                y=a[k+i/2]*w;
                a[k]=x+y;
                a[k+i/2]=x-y;
                w=w*wn;
            }
        }
    }
    if(f==-1) for(i=0;i<N;++i) a[i].x/=(double)N;
}
int main(){
    double sum=0;
    int i,ans=0,j,len;
    for(i=0;i<2;++i){
        char ch=getchar();
        while(1){
            if((ch>='a'&&ch<='z')||ch=='?') break;
            ch=getchar();
        }
        while((ch>='a'&&ch<='z')||ch=='?'){
            s[i][++l[i]]=(ch=='?')?0:(ch-'a'+1);
            ch=getchar();
        }
    }
    for(i=1;i<=l[1]/2;++i) swap(s[1][i],s[1][l[1]-i+1]);
    for(N=1;N<l[0];N<<=1,L+=1); N<<=1;L+=1;
    for(i=0;i<N;++i){
        for(j=i,len=0;j;j>>=1) dig[len++]=j&1;
        for(j=0;j<L;++j) rev[i]=rev[i]*2+dig[j];
    }
    for(i=0;i<l[0];++i) a[i]=(S){Pow(s[0][i+1]),0.};
    for(i=0;i<l[1];++i){
        b[i]=(S){(double)s[1][i+1],0.};
        sum+=POW(s[1][i+1]);
    }
    FFT(a,1);FFT(b,1);
    for(i=0;i<N;++i) c[i]=a[i]*b[i];
    memset(a,0,sizeof(a));
    memset(b,0,sizeof(b));
    for(i=0;i<l[0];++i) a[i]=(S){(double)s[0][i+1],0.};
    for(i=0;i<l[1];++i) b[i]=(S){Pow(s[1][i+1]),0.};
    FFT(a,1);FFT(b,1);
    for(i=0;i<N;++i) c[i]=c[i]-(a[i]*b[i])-(a[i]*b[i]);
    FFT(c,-1);
    for(i=l[1]-1;i<l[0];++i)
      if((int)(c[i].x+sum+0.5)==0) ++ans;
    for(printf("%d\n",ans),i=l[1]-1;i<l[0];++i)
      if((int)(c[i].x+sum+0.5)==0) printf("%d\n",i-l[1]+1);
}