7-1 字符串模式匹配(KMP)
给定一个字符串 text 和一个模式串 pattern,求 pattern 在text 中的出现次数。text 和 pattern 中的字符均为英语大写字母或小写字母。text中不同位置出现的pattern 可重叠。
输入格式:
输入共两行,分别是字符串text 和模式串pattern。
输出格式:
输出一个整数,表示 pattern 在 text 中的出现次数。
输入样例1:
zyzyzyz
zyz
输出样例1:
3
输入样例2:
AABAACAADAABAABA
AABA
输出样例2:
3
数据范围与提示:
1≤text, pattern 的长度 ≤106, text、pattern 仅包含大小写字母。
#include<stdio.h>
#include<string.h>
int main()
{
char s[1000010],p[1000010];
int next[1000010];
scanf("%s %s",s+1,p+1);
int n=strlen(s+1),m=strlen(p+1);
int j=0,i;
for(i=2;i<=m;i++)//next数组记录
{ //next[i]的值表示下标为i的字符串前的字符串的最长相等前后缀的长度
//也表示该处字符不匹配时应该回溯到的字符的下标
while(j&&p[i]!=p[j+1])
j=next[j];
if(p[i]==p[j+1])
j++;
next[i]=j;
}
int cot=0;
j=0;
for(i=1;i<=n;i++)
{
while(j&&s[i]!=p[j+1])
j=next[j];
if(s[i]==p[j+1])
j++;//匹配成功,后移
if(j==m)
{
cot++;
j=next[j];//注意更新j
}
}
printf("%d",cot);
return 0;
}
7-2 【模板】KMP字符串匹配
给出两个字符串text和pattern,其中pattern为text的子串,求出pattern在text中所有出现的位置。
为了减少骗分的情况,接下来还要输出子串的前缀数组next。
输入格式:
第一行为一个字符串,即为text。
第二行为一个字符串,即为pattern。
输出格式:
若干行,每行包含一个整数,表示pattern在text中出现的位置。
接下来1行,包括length(pattern)个整数,表示前缀数组next[i]的值,数据间以一个空格分隔,行尾无多余空格。
输入样例:
ABABABC
ABA
输出样例:
1
3
0 0 1
样例说明:
#include<string.h>
#include<stdio.h>
#define MAXN 1000010
int next[MAXN];
int s1,s2,j;
char a[MAXN],b[MAXN],d;
int main()
{
scanf("%s",a+1);
scanf("%s",b+1);
s1=strlen(a+1);
s2=strlen(b+1);
int i;
for (i=2;i<=s2;i++)//建立next数组用于记录该位置前最长相等前后缀的组数;
{
while(j&&b[i]!=b[j+1])
{
j=next[j];
}
if(b[j+1]==b[i])
{
j++;
}
next[i]=j;
}
j=0;
for(i=1;i<=s1;i++)
{
while(j&&b[j+1]!=a[i])
{
j=next[j];
}
if(b[j+1]==a[i])
{
j++;
}
if(j==s2)
{
printf("%d\n",i-s2+1);//输出出现的位置
j=next[j];
}
}
for(i=1;i<=s2-1;i++)
{
printf("%d ",next[i]);
}
printf("%d",next[s2]);//输出next数组记录的值&#