【BZOJ4503】两个串

本文介绍了一种利用快速傅立叶变换(FFT)解决含有通配符的字符串匹配问题的方法。通过对字符串进行特殊处理并利用FFT进行高效计算,解决了传统算法无法处理通配符的问题。文章提供了详细的算法步骤及实现代码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

【题目链接】

【前置技能】

  • FFT/NTT

【题解】

  • 字符串中出现了通配符,一般的字符串算法就失去效果了。
  • 先忽略通配符的问题。得到一种算法:令每个位置 Ak=i=0LenT1(Si+kLenT+1Ti) A k = ∑ i = 0 L e n T − 1 ( S i + k − L e n T + 1 − T i ) ,若 Ak=0 A k = 0 ,则说明 T T S[kLenT+1,k]匹配。但发现这会出错,相减项有可能会正负抵消,如字符串ab和ba就会被认为是匹配的。得到了一种解决方法:将求和中的减法变成相减之后平方就可以避免抵消的问题了。
  • 把T整个串翻转一下,然后把平方展开,发现这是卷积的形式。那么通配符的问题也很好想明白了,在式子上再乘上一个 Ti T i ,其中通配符的值为零即可。
  • 最后的式子: Ak=i=0k(TkiS2i)2i=0k(T2kiSi)+i=0kT3ki A k = ∑ i = 0 k ( T k − i ∗ S i 2 ) − 2 ∗ ∑ i = 0 k ( T k − i 2 ∗ S i ) + ∑ i = 0 k T k − i 3
  • 时间复杂度 O(NlogN) O ( N l o g N )

【代码】

#include<bits/stdc++.h>
#define INF 0x3f3f3f3f
#define LL  long long
#define MAXN    262150
#define EPS 1e-3
using namespace std;
const double PI = acos(-1);
char s[MAXN], t[MAXN];
int n, LOG, ls, lt, rev[MAXN]; 
struct dot{double x, y;}ans[MAXN], a[MAXN], b[MAXN];
dot operator + (dot a, dot b){return (dot){a.x + b.x, a.y + b.y};}
dot operator - (dot a, dot b){return (dot){a.x - b.x, a.y - b.y};}
dot operator * (dot a, dot b){return (dot){a.x * b.x - a.y * b.y, a.x * b.y + a.y * b.x};}
dot operator / (dot a, double k){return (dot){a.x / k, a.y / k};}

template <typename T> void chkmin(T &x, T y){x = min(x, y);}
template <typename T> void chkmax(T &x, T y){x = max(x, y);}
template <typename T> void read(T &x){
    x = 0; int f = 1; char ch = getchar();
    while (!isdigit(ch)) {if (ch == '-') f = -1; ch = getchar();}
    while (isdigit(ch)) {x = x * 10 + ch - '0'; ch = getchar();}
    x *= f;
}

void fft_init(){
    rev[0] = 0;
    for (int i = 1; i < n; ++i)
        rev[i] = (rev[i >> 1] >> 1) | ((i & 1) << (LOG - 1));
}

void fft(dot *a, int opt){
    for (int i = 0; i < n; ++i)
        if (rev[i] < i) swap(a[rev[i]], a[i]);
    for (int len = 2; len <= n; len <<= 1){
        dot delta = (dot){cos(PI * 2 / len), sin(PI * 2 / len * opt)};
        for (int i = 0; i < n; i += len){
            dot cur = (dot){1, 0};
            for (int j = i, k = i + len / 2; k < i + len; ++j, ++k){
                dot tmp = a[j], tnp = a[k] * cur;
                a[j] = tmp + tnp;
                a[k] = tmp - tnp;
                cur = cur * delta;
            }
        }
    }
    if (opt == -1){
        for (int i = 0; i < n; ++i)
            a[i] = a[i] / n;
    }
}

bool sam(double x, double y){
    if (x > y - EPS && x < y + EPS) return 1;
    return 0;
}

int id(char ch){
    if (ch == '?' || ch == '\0') return 0;
    else return (ch - 'a' + 1);
}

int main(){
    scanf("%s", s);
    scanf("%s", t);
    ls = strlen(s); lt = strlen(t);
    reverse(t, t + lt);
    n = 1, LOG = 0;
    while (n <= ls + lt) n <<= 1, ++LOG;
    fft_init();
    for (int i = 0; i < n; ++i)
        a[i].x = id(t[i]), a[i].y = 0,
        b[i].x = id(s[i]), b[i].y = 0, b[i] = b[i] * b[i];
    for (int i = 0; i < n; ++i)
        ans[i] = a[i] * a[i] * a[i];
    for (int i = 1; i < n; ++i)
        ans[i] = ans[i] + ans[i - 1];

    fft(a, 1); fft(b, 1);
    for (int i = 0; i < n; ++i)
        a[i] = a[i] * b[i];
    fft(a, -1);
    for (int i = 0; i < n; ++i)
        ans[i] = ans[i] + a[i];

    for (int i = 0; i < n; ++i)
        a[i].x = id(t[i]), a[i].y = 0, a[i] = a[i] * a[i],
        b[i].x = id(s[i]), b[i].y = 0;
    fft(a, 1); fft(b, 1);
    for (int i = 0; i < n; ++i)
        a[i] = a[i] * b[i];
    fft(a, -1);
    for (int i = 0; i < n; ++i)
        ans[i] = ans[i] - (a[i] / 0.5);

    int cnt = 0;
    for (int i = lt - 1; i < ls; ++i)
        if (sam(ans[i].x, 0)) ++cnt;
    printf("%d\n", cnt);
    for (int i = lt - 1; i < ls; ++i)
        if (sam(ans[i].x, 0)) printf("%d\n", i - lt + 1);
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值