数据结构(C语言)——4串:串匹配

这篇博客介绍了在C语言中实现串匹配的方法,包括基础的BF算法和更高效的KMP算法。通过理解匹配失败函数(pi函数)的概念,可以优化匹配过程,减少不必要的回溯。KMP算法以其固定的O(m+n)时间复杂度优于BF算法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

趁着复习把课上的作业和代码上传上来嘿嘿嘿,这个系列的代码都是自己写的或者老师教学用的可能内存管理上有点小瑕疵,但是算法理解还是不错的!本系列所有代码在dev-cpp上可以跑通~

描述:

在主串中查找子串,返回第一个匹配的位置(提供子串和主串的长度)。

思路:

BF:在主串中逐个匹配子串,直到完全匹配,返回位置

KMP:也是主串中匹配,但事先计算匹配失败函数(pi函数,记录子串中某个位置匹配失败的时候应该跳转到字串的位置),匹配失败的时候,主串指针直接往失败位置向下跳转,子串指针取pi函数的跳转值。

代码:

BF(平均O(m+n),最坏O((n-m)*m))代码:

#include <stdio.h>

int n, m;
char a[500000], b[500000];

int Index(char*S, char*T, int pos){
	int i=pos, j;
	while(i<n){
		for(j=0;j<m;j++){
			if(b[j]!=a[i]){
				break;
			}
			i++;
		}
		if(j==m){
			return i-j+1;
		}
		else{
			i=i-j+1;
		}
	}
	return -1;
} 

int main() {
	int pos=0;
	scanf("%d", &n); getchar(); gets(a);
	scanf("%d", &m); getchar(); gets(b);
    scanf("%d", &pos);
	printf("%d", Index(a,b,pos));
    return 0;
}

KMP(怎样都是O(m+n))代码:

#include <stdio.h>
const int maxn = 1000000;

int n, m, pos;
char S[maxn + 1], T[maxn + 1];
int pi[maxn+1];

void compute_pi(){
	int i=0,j=-1;
	while(i<m-1){
		if(T[i+1]==T[j+1]){
			i++;
			j++;
			pi[i]=j;
		}
		else if(j==-1){
			i++;
			pi[i]=j;
		}
		else{
			j=pi[j];
		}
	}
}
int string_Index(){
	int i=pos-1,j=-1;
	while(i<n-1){
		if(S[i+1]==T[j+1]){
			i++;
			j++;
			if(j==m-1){
				return i-j+1;
			}
		}
		else if(j==-1){
			i++;
		}
		else{
			j=pi[j];
		}
	}
}
int main(){
	scanf("%d", &n); getchar(); gets(S);
	scanf("%d", &m); getchar(); gets(T);
	scanf("%d", &pos);
	compute_pi();
    printf("%d", string_Index());
	return 0;
}

pi函数的计算和匹配思路其实是一样的,或者说是递推出来的,如何计算可以画一下串理解一下。

KMP和BF的区别主要是,KMP提前计算了匹配失败时应该跳转到的位置,所以他的探索是已知的,就不用像BF一样从头跳来跳去的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值