KMP算法 ← C++实现

hnjzsyjyj

已于 2024-08-21 22:03:10 修改

阅读量1.7k

点赞数 4

分类专栏：信息学竞赛 # 字符串与高精度文章标签： KMP算法

于 2022-09-29 20:01:09 首次发布

本文链接：https://blog.youkuaiyun.com/hnjzsyjyj/article/details/127112363

版权

信息学竞赛同时被 2 个专栏收录

997 篇文章

订阅专栏

字符串与高精度

62 篇文章

订阅专栏

KMP算法是一种高效的字符串模式匹配算法，能在O(n+m)时间内完成匹配操作。核心是next数组，它只依赖模式串自身。算法分为求next数组和匹配字符串两步。当模式串与主串失配时，利用next数组移动模式串位置继续比较。本文提供了C++实现KMP算法的详细步骤和代码示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

【KMP算法简介】
KMP算法是由克努特(Knuth)、莫里斯(Morris)和普拉特(Pratt)共同设计实现的，因此简称KMP算法。此算法可以在O(n+m)的时间数量级上完成串的模式匹配操作。KMP算法中模式串T的next数组，是KMP算法的核心。
KMP算法中的next数组仅取决于模式串本身，而与相匹配的主串无关。
next数组的核心作用是“当模式串T的第j位与主串S的第pos位失配时（即 T[j]≠S[pos] 时），让模式串T的第next[j]位与主串S的第pos位再进行比较”。这相当于让模式串T往右移动了 j-next[j] 位后，再进行比较。

【KMP算法步骤】
KMP算法本身并不复杂，但绝大部分的文章把它讲混乱了，以致造成很多混淆。KMP算法主要分为两步：求next[ ]数组、匹配字符串。
一、求next[ ]数组
由于字符串的下标从0开始，因此在KMP算法的设计中，将模式串下标从0开始计数，是很自然的事情。据此，可定义next[0]=-1，next[1]=0。之后，按照“（1）若第i-1位的字符与第j位的字符相等，则next[i]=j+1；（2）若直到第0位依然没有字符与第i-1位的字符相等，则next[i]=0”构建next数组。

最后，利用循环体中的语句 cout<<next[i]; 便可输出以“-1 0 ”开头的next数组值。若想输出以“0 1”开头的next数组值，只需修改语句cout<<next[i]; 为 cout<<next[i]+1; 便可。

二、匹配字符串
此步主要体现了next()数组的核心作用，即“当模式串T的第j位与主串S的第pos位失配时（即 T[j]≠S[pos] 时），让模式串T的第next[j]位与主串S的第pos位再进行比较”。这相当于让模式串T往右移动了 j-next[j] 位后，再与主串进行比较。

【KMP算法代码】

#include<iostream>
using namespace std;

const int maxn=100;
int ne[maxn];

void getNext(string s) {
	int len=s.length();
	int i=0, j=-1;
	ne[0]=-1;
	while(i<len) {
		if(j==-1 || s[i]==s[j]) {
			i++;
			j++;
			ne[i]=j;
		} else j=ne[j];
	}
}

int KMP(string S,string T) {
	int lens=S.length();
	int lent=T.length();
	int i=0;
	int j=0;
	while(i<lens && j<lent) {
		if(j==-1 || S[i]==T[j]) {
			i++;
			j++;
		} else j=ne[j];
	}

	if(j==lent) return i-j+1;
	else return -1;
}

int main() {
	string S,T;
	getline(cin,S);
	getline(cin,T);

	getNext(T);
	cout<<KMP(S,T)<<endl;

	return 0;
}


/*
input:
i love china.
e c

output:
6
*/

【参考文献】
https://blog.youkuaiyun.com/hnjzsyjyj/article/details/127086502
https://blog.youkuaiyun.com/hnjzsyjyj/article/details/127105603