【模板】KMP字符串匹配
题目描述
给出两个字符串 s1s_1s1 和 s2s_2s2,若 s1s_1s1 的区间 [l,r][l, r][l,r] 子串与 s2s_2s2 完全相同,则称 s2s_2s2 在 s1s_1s1 中出现了,其出现位置为 lll。
现在请你求出 s2s_2s2 在 s1s_1s1 中所有出现的位置。
定义一个字符串 sss 的 border 为 sss 的一个非 sss 本身的子串 ttt,满足 ttt 既是 sss 的前缀,又是 sss 的后缀。
对于 s2s_2s2,你还需要求出对于其每个前缀 s′s's′ 的最长 border t′t't′ 的长度。
输入格式
第一行为一个字符串,即为 s1s_1s1。
第二行为一个字符串,即为 s2s_2s2。
输出格式
首先输出若干行,每行一个整数,按从小到大的顺序输出 s2s_2s2 在 s1s_1s1 中出现的位置。
最后一行输出 ∣s2∣|s_2|∣s2∣ 个整数,第 iii 个整数表示 s2s_2s2 的长度为 iii 的前缀的最长 border 长度。
样例 #1
样例输入 #1
ABABABC
ABA
样例输出 #1
1
3
0 0 1
提示
样例 1 解释
。
对于 s2s_2s2 长度为 333 的前缀 ABA,字符串 A 既是其后缀也是其前缀,且是最长的,因此最长 border 长度为 111。
数据规模与约定
本题采用多测试点捆绑测试,共有 3 个子任务。
- Subtask 1(30 points):∣s1∣≤15|s_1| \leq 15∣s1∣≤15,∣s2∣≤5|s_2| \leq 5∣s2∣≤5。
- Subtask 2(40 points):∣s1∣≤104|s_1| \leq 10^4∣s1∣≤104,∣s2∣≤102|s_2| \leq 10^2∣s2∣≤102。
- Subtask 3(30 points):无特殊约定。
对于全部的测试点,保证 1≤∣s1∣,∣s2∣≤1061 \leq |s_1|,|s_2| \leq 10^61≤∣s1∣,∣s2∣≤106,s1,s2s_1, s_2s1,s2 中均只含大写英文字母。
#include <cstdio>
#include <cstring>
char p[1000005], t[1000005];
int len1, len2;
int next[1000005], next2[1000005];
void do_next()
{
next[0] = 0;
int i = 1;
int len = 0;
while (i < len2)
{
if (t[i] == t[len])
next[i++] = ++len;
else
{
if (len > 0)
len = next[len - 1];
else
next[i++] = len;
}
}
}
void kmp()
{
int i = 0, j = 0;
next2[0] = -1;
for (int i = 1; i < len2; i++)
next2[i] = next[i - 1];
while (i < len1)
{
if (j == len2 - 1 && p[i] == t[j])
{
printf("%d\n", i - j + 1);
j = next2[j];
if (j == -1)
j++;
}
if (p[i] == t[j])
{
j++;
i++;
}
else
{
j = next2[j];
if (j == -1)
{
i++;
j++;
}
}
}
}
int main()
{
scanf("%s%s", p, t);
len1 = strlen(p);
len2 = strlen(t);
do_next();
kmp();
for (int i = 0; i < len2; i++)
printf("%d ", next[i]);
return 0;
}
本文详细介绍了KMP算法在解决字符串匹配问题中的应用,通过实例展示了如何找到一个字符串在另一个字符串中出现的所有位置。同时,探讨了字符串的border概念,并给出了求解字符串前缀最长border长度的方法。对于不同规模的数据,KMP算法都能有效处理,确保了高效性和准确性。
633

被折叠的 条评论
为什么被折叠?



