趁着复习把课上的作业和代码上传上来嘿嘿嘿,这个系列的代码都是自己写的或者老师教学用的可能内存管理上有点小瑕疵,但是算法理解还是不错的!本系列所有代码在dev-cpp上可以跑通~
描述:
在主串中查找子串,返回第一个匹配的位置(提供子串和主串的长度)。
思路:
BF:在主串中逐个匹配子串,直到完全匹配,返回位置
KMP:也是主串中匹配,但事先计算匹配失败函数(pi函数,记录子串中某个位置匹配失败的时候应该跳转到字串的位置),匹配失败的时候,主串指针直接往失败位置向下跳转,子串指针取pi函数的跳转值。
代码:
BF(平均O(m+n),最坏O((n-m)*m))代码:
#include <stdio.h>
int n, m;
char a[500000], b[500000];
int Index(char*S, char*T, int pos){
int i=pos, j;
while(i<n){
for(j=0;j<m;j++){
if(b[j]!=a[i]){
break;
}
i++;
}
if(j==m){
return i-j+1;
}
else{
i=i-j+1;
}
}
return -1;
}
int main() {
int pos=0;
scanf("%d", &n); getchar(); gets(a);
scanf("%d", &m); getchar(); gets(b);
scanf("%d", &pos);
printf("%d", Index(a,b,pos));
return 0;
}
KMP(怎样都是O(m+n))代码:
#include <stdio.h>
const int maxn = 1000000;
int n, m, pos;
char S[maxn + 1], T[maxn + 1];
int pi[maxn+1];
void compute_pi(){
int i=0,j=-1;
while(i<m-1){
if(T[i+1]==T[j+1]){
i++;
j++;
pi[i]=j;
}
else if(j==-1){
i++;
pi[i]=j;
}
else{
j=pi[j];
}
}
}
int string_Index(){
int i=pos-1,j=-1;
while(i<n-1){
if(S[i+1]==T[j+1]){
i++;
j++;
if(j==m-1){
return i-j+1;
}
}
else if(j==-1){
i++;
}
else{
j=pi[j];
}
}
}
int main(){
scanf("%d", &n); getchar(); gets(S);
scanf("%d", &m); getchar(); gets(T);
scanf("%d", &pos);
compute_pi();
printf("%d", string_Index());
return 0;
}
pi函数的计算和匹配思路其实是一样的,或者说是递推出来的,如何计算可以画一下串理解一下。
KMP和BF的区别主要是,KMP提前计算了匹配失败时应该跳转到的位置,所以他的探索是已知的,就不用像BF一样从头跳来跳去的。