【模板】KMP字符串匹配

最新推荐文章于 2024-07-28 11:23:31 发布

原创最新推荐文章于 2024-07-28 11:23:31 发布 · 642 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #c++

洛谷专栏收录该内容

129 篇文章

订阅专栏

本文详细介绍了KMP算法在解决字符串匹配问题中的应用，通过实例展示了如何找到一个字符串在另一个字符串中出现的所有位置。同时，探讨了字符串的border概念，并给出了求解字符串前缀最长border长度的方法。对于不同规模的数据，KMP算法都能有效处理，确保了高效性和准确性。

【模板】KMP字符串匹配

题目描述

给出两个字符串 $s_1$ 和 $s_2$ ，若 $s_1$ 的区间 $[l, r]$ 子串与 $s_2$ 完全相同，则称 $s_2$ 在 $s_1$ 中出现了，其出现位置为 $l$ 。
现在请你求出 $s_2$ 在 $s_1$ 中所有出现的位置。

定义一个字符串 $s$ 的 border 为 $s$ 的一个非 $s$ 本身的子串 $t$ ，满足 $t$ 既是 $s$ 的前缀，又是 $s$ 的后缀。
对于 $s_2$ ，你还需要求出对于其每个前缀 $s^{'}$ 的最长 border $t^{'}$ 的长度。

输入格式

第一行为一个字符串，即为 $s_1$ 。
第二行为一个字符串，即为 $s_2$ 。

输出格式

首先输出若干行，每行一个整数，按从小到大的顺序输出 $s_2$ 在 $s_1$ 中出现的位置。
最后一行输出 $s_2|$ 个整数，第 $i$ 个整数表示 $s_2$ 的长度为 $i$ 的前缀的最长 border 长度。

样例 #1

样例输入 #1

ABABABC
ABA

样例输出 #1

1
3
0 0 1

提示

样例 1 解释

。

对于 $s_2$ 长度为 $3$ 的前缀 ABA，字符串 A 既是其后缀也是其前缀，且是最长的，因此最长 border 长度为 $1$ 。

数据规模与约定

本题采用多测试点捆绑测试，共有 3 个子任务。

Subtask 1（30 points）： $∣s1∣≤15|s_1| \leq 15$ ， $∣s2∣≤5|s_2| \leq 5$ 。
Subtask 2（40 points）： $∣s1∣≤104|s_1| \leq 10^4$ ， $∣s2∣≤102|s_2| \leq 10^2$ 。
Subtask 3（30 points）：无特殊约定。

对于全部的测试点，保证 $\leq |s_1|,|s_2| \leq 10^6$ ， $s_1, s_2$ 中均只含大写英文字母。

#include <cstdio>
#include <cstring>

char p[1000005], t[1000005];
int len1, len2;
int next[1000005], next2[1000005];

void do_next()
{
    next[0] = 0;
    int i = 1;
    int len = 0;

    while (i < len2)
    {
        if (t[i] == t[len])
            next[i++] = ++len;
        else
        {
            if (len > 0)
                len = next[len - 1];
            else
                next[i++] = len;
        }
    }
}

void kmp()
{
    int i = 0, j = 0;
    next2[0] = -1;
    
    for (int i = 1; i < len2; i++)
        next2[i] = next[i - 1];
    
    while (i < len1)
    {
        if (j == len2 - 1 && p[i] == t[j])
        {
            printf("%d\n", i - j + 1);
            j = next2[j];
            if (j == -1)
                j++;
        }
        if (p[i] == t[j])
        {
            j++;
            i++;
        }
        else
        {
            j = next2[j];
            if (j == -1)
            {
                i++;
                j++;
            }
        }
    }
}

int main()
{
    scanf("%s%s", p, t);
    len1 = strlen(p);
    len2 = strlen(t);

    do_next();

    kmp();

    for (int i = 0; i < len2; i++)
        printf("%d ", next[i]);

    return 0;
}