CF494B Obsessive String 题解（KMP/HASH+DP）

最新推荐文章于 2019-01-07 09:48:50 发布

原创最新推荐文章于 2019-01-07 09:48:50 发布 · 390 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#题解

状压dp 专栏收录该内容

5 篇文章

订阅专栏

本文深入探讨了一道关于字符串匹配的问题，通过KMP算法和哈希方法定位子串，并运用动态规划计算满足条件的子串数量。文章详细介绍了算法流程及核心数据结构，为读者提供了清晰的解题思路。

先说明一下本题的题意，因为题目太难读了。。。题目大意:给出两个字符串，

求有多少个字符串，包含二串，且为一串的子串，而且互相不重叠，解释一下样例。

一串：ddd

二串：d

这里将一串的ddd分别标号为123

答案为：1 ， 2， 3， 12 3 ，1 23 ， 123 ，1 2，2 3，1 3 ，12 ，23 ，1 2 3。

看到这应该有一些思路了吧，这道题支持两种算法。但是目的是一样的。

用kmp匹配二串在一串中完全成功匹配的位置，设这个位置为flag[i] = 1。

这个会kmp应该不用说了吧，hash的话可以直接判断s1[i-l2+1] == s2时进行操作

至于dp，先介绍一下各数组的含义，f代表以目标串s2为结尾的串的个数，

sum1为f的前缀和，sum2为sum1的前缀和

如果这个位为结尾时没有匹配那么直接f[i] = f[i-1],把这个值传下去。

那么如果i位为结尾时匹配到s2，f[i] = sum2[i-l2]+i-l2+1.

因为以这个这个位为结尾是包含二串的串的开头可以从1~i-l2+1，所以一共有i-l2+1种方案

是只有一个包含这个二串的串的。

而如果有多个呢。

我们可以感性yy一下，当前串起点为2~i-l2+1时，上一个和他组合的串的结尾可以为1~i-l2

如果上一个串终点为k，那么1~k都可以和当前串组合。这就是sum1的含义

因为结尾为1~i-l2，所以sum2为sum1的合

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
#define mode 1000000007
#define seed 13131
using namespace std;
typedef long long ll;
char s1[100005];
char s2[100005];
unsigned long long p1[100005];
unsigned long long ss1[100005];
unsigned long long ss2;
ll f[100005];
ll sum1[100005];
ll sum2[100005];
int main()
{
    scanf("%s",s1+1);
    scanf("%s",s2+1);
    int l1 = strlen(s1+1),l2 = strlen(s2+1);
    p1[0] = 1;
    for(int i = 1;i <= l1;i++)
    {
        p1[i] = p1[i-1]*seed;
        ss1[i] = ss1[i-1]*seed+s1[i]-'a'+1;
    }
    for(int i = 1;i <= l2;i++)
    {
        ss2 = ss2*seed+s2[i]-'a'+1;
    }
    for(int i = 1;i <= l1;i++)
    {
        if(i-l2+1 >= 1)
        {
            if(ss1[i]-p1[l2]*ss1[i-l2] == ss2)
            {
                f[i] = sum2[i-l2]+i-l2+1;
                f[i] %= mode;
            }else
            {
                f[i] = f[i-1];
            }
            sum1[i] = sum1[i-1]+f[i];
            sum2[i] = sum2[i-1]+sum1[i];
        }
    }
    ll ans = 0;
    for(int i = 1;i <= l1;i++)
    {
        ans += f[i];
        ans %= mode;
    }
    printf("%lld",ans);
    return 0;
}