笔试题10——KMP算法

本文介绍了KMP字符串查找算法,其利用部分匹配信息,保持i指针不回溯,修改j指针让模式串移动到有效位置。阐述了算法流程,解释了next数组含义,指出匹配过程时间复杂度为O(n),整体复杂度为O(m + n),还推荐了相关分析博客。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

KMP算法(字符串查找算法)
算法思想:
利用已经部分匹配这个有效信息,保持i指针不回溯,通过修改j指针,让模式串尽量地移动到有效的位置。
算法流程:
假设现在在文本串s匹配到i位置,模式串p匹配到j位置:
1.如果j=-1,或者当前字符匹配成功(即s[i]==p[j]),都令i++,j++,继续匹配下一个字符;
2.如果j!=-1,并且当前字符匹配失败(即s[i]!=p[j]),都令i不变,j=next[j]。
当匹配失败时,j要移动的下一个位置k。存在着这样的性质:最前面的k个字符和j之前的最后k个字符是一样的。因此next[j]的值(也就是k)表示,当s[i]!=p[j]时,j指针的下一步移动位置。
next数组含义:表示当前字符之前的字符串中,有多大长度的相同前缀后缀。
核心代码如下:

#include <iostream>
#include <algorithm>
     
using namespace std;
int* GetNextval(char* p);
int KmpSearch(char* s, char* p){
	int i = 0;
	int j = 0;
	int slen = strlen(s);
	int plen = strlen(p);
	cout << "slen =  " << slen << endl;
	cout << "plen =  " << plen << endl;
	int* next = GetNextval(p);

	while(i < slen && j < plen){
		if(j == -1 || s[i] == p[j]){
			i++;
			j++;
		}else{
			j = next[j];
		}
		cout << "i =  " << i << ", j =  " << j << endl;
	}
	cout << "i =  " << i << endl;
	cout << "j =  " << j << endl;
	if(j == plen)
		return i - j;
	else
		return -1;
}

int* GetNextval(char* p){
	int plen = strlen(p);
	int* next = new int[plen];
	next[0] = -1;
	int k = -1;
	int j = 0;
	while(j < plen - 1){
		if(k == -1 || p[j] == p[k]){
			j++;
			k++;
			if(p[j] != p[k])
				next[j] = k;
			else  //当两个字符相等时要跳过
				next[j] = next[k];
		}
		else{
			k = next[k];
		}
	}
	
	cout << "-------next数组--------" << endl;
	for(int m = 0; m < plen; m++){
		cout << next[m] << " ";
	}
	cout << endl;
	cout << "-----------------------" << endl;

	return next;
}

int main(){
	char* s = "abcdefg";
	char* p = "bcd";
	int result = KmpSearch(s, p);
	cout << "字符串匹配的起始位置为: " << result << endl;

	return 0;
}

如果文本串的长度为n,模式串的长度为m,那么匹配过程的时间复杂度为O(n),算上计算next数组的O(m)时间,KMP的整体时间复杂度为O(m+n)。
这位博主大佬分析的比较通俗易懂,推荐给大家:
https://www.cnblogs.com/yjiyjige/p/3263858.html

KMP算法是一种字符串匹配算法,用于在一个文本串S内查找一个模式串P的出现位置。它的时间复杂度为O(n+m),其中n为文本串的长度,m为模式串的长度。 KMP算法的核心思想是利用已知信息来避免不必要的字符比较。具体来说,它维护一个next数组,其中next[i]表示当第i个字符匹配失败时,下一次匹配应该从模式串的第next[i]个字符开始。 我们可以通过一个简单的例子来理解KMP算法的思想。假设文本串为S="ababababca",模式串为P="abababca",我们想要在S中查找P的出现位置。 首先,我们可以将P的每个前缀和后缀进行比较,得到next数组: | i | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | | --- | - | - | - | - | - | - | - | - | | P | a | b | a | b | a | b | c | a | | next| 0 | 0 | 1 | 2 | 3 | 4 | 0 | 1 | 接下来,我们从S的第一个字符开始匹配P。当S的第七个字符和P的第七个字符匹配失败时,我们可以利用next[6]=4,将P向右移动4个字符,使得P的第五个字符与S的第七个字符对齐。此时,我们可以发现P的前五个字符和S的前五个字符已经匹配成功了。因此,我们可以继续从S的第六个字符开始匹配P。 当S的第十个字符和P的第八个字符匹配失败时,我们可以利用next[7]=1,将P向右移动一个字符,使得P的第一个字符和S的第十个字符对齐。此时,我们可以发现P的前一个字符和S的第十个字符已经匹配成功了。因此,我们可以继续从S的第十一个字符开始匹配P。 最终,我们可以发现P出现在S的第二个位置。 下面是KMP算法的C++代码实现:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值