题目描述
这是一道模板题。
给定一个字符串 SSS 和一个字符串 TTT,求 SSS 在 TTT 中的出现次数。SSS 和 TTT 中的字符均为英语大写字母或小写字母。
SSS 中不同位置出现的 TTT 可重叠。
输入格式
输入共两行,分别是字符串 SSS 和字符串 TTT。
输出格式
输出一个整数,表示 TTT 在 SSS 中的出现次数。
输入样例
abcabcabd
abcabd
样例输出
1
数据范围
1≤∣S∣,∣T∣≤1061 \leq |S|, |T| \leq 10^61≤∣S∣,∣T∣≤106,S,TS, TS,T 仅包含大小写字母。
题目解答
在解决这道题之前,我们先要了解一些关于字符串的基本知识->:
- 后缀:指从某一位置 iii 开始到整个字符串 SSS 末尾的一个子串,表示为 Suffix(S,i)\text{Suffix}(S, i)Suffix(S,i)。
真后缀指的是除了 SSS 本身的 SSS 的后缀。 - 前缀:指从 SSS 的串首到某一位置 iii 的一个子串,表示为 Prefix(S,i)\text{Prefix}(S, i)Prefix(S,i)。
真前缀指的是除了 SSS 本身的 SSS 的前缀。
例如,ababab 就是 abcdabcdabcd 的前缀和真前缀,yxayxayxa 是 axyxaaxyxaaxyxa 的后缀和真后缀。
zyzzyzzyz 是 zyzzyzzyz 的前缀和后缀,但它不是 zyzzyzzyz 真前缀或是真后缀。
而题目要求我们从 SSS 统计 TTT 出现的次数,那我们就将 SSS 串称为主串,TTT 串称为模式串,从 SSS 中找 TTT 的过程就叫模式串匹配。
了解完这些后,让我们进入正题吧——如何进行快速模式串匹配?
(声明:接下来所有的字符串和数组的下标都从 000 开始)
策略一—— O(mn)O(mn)O(mn) 爆炒
作为一个合格的蒟蒻,开始做题是想的不是正解,而是暴力。很容易想到可以暴力双指针维护,先从主串 SSS 和模式串 TTT 的首位字符开始比较:
- 若两个值相等,继续比较它们的下一位字符
- 若不相等,模式串 TTT 的字符回退到第一个字符,在与 SSS 的二个字符进行比较
- 若 TTT 中的所有字符都与 SSS 中跟它比较的字符对应相等,那么答案++
直到 SSS 中的字符比较完毕,即可得到答案。代码如下:
#include <bits/stdc++.h>
using namespace std;
int ans, len1, len2;
char s[1000005], t[1000005];
int main()
{
scanf("%s %s", s, t);
len1 = strlen(s), len2 = strlen(t);
for (int i = 0; i < len1 - len2 + 1; i++)
{
bool mark = true;
for (int j = 0; j < len2; j++)
if (s[i + j] != t[j])
{
mark = false;
break;
}
if (mark)
ans++;
}
printf("%d", ans);
return 0;
}
可以发现,在最坏的情况下,每次与 TTT 都要比较到最后一个字符才能得出结论。令 ∣S∣=n,∣T∣=m|S| = n, |T| = m∣S∣=n,∣T∣=m。
需执行 m(n−m+1)m(n - m + 1)m(n−