KMP是字符串模式匹配算法,主要的核心:
对于目标字符串ptr,ababaca,长度是7,所以next[0],next[1],next[2],next[3],next[4],next[5],next[6]分别计算的是
a,ab,aba,abab,ababa,ababac,ababaca的相同的最长前缀和最长后缀的长度。由于a,ab,aba,abab,ababa,ababac,ababaca的相同的最长前缀和最长后缀是“”,“”,“a”,“ab”,“aba”,“”,“a”,所以next数组的值是[-1,-1,0,1,2,-1,0],这里-1表示不存在,0表示存在长度为1,2表示存在长度为3。这是为了和代码相对应。
next数组就是说一旦在某处不匹配时(下图绿色位置A和B),移动ptr字符串,使str的对应的最大后缀(红色2)和ptr对应的最大前缀(红色3)对齐,然后比较A和C。
next数组的值,就是下次往前移动字符串ptr的移动距离。比如next中某个字符对应的值是4,则在该字符后的下一个字符不匹配时,可以直接移动往前移动ptr 5个长度,再次进行比较判别。
#include <iostream>
#include <vector>
#include <string>
using namespace std;
void buildnext(string& s, vector<int>& next, int n)
{
//next[j]的值(也就是k)表示,当P[j] != T[i]时,j指针的下一步移动位置。
int k = -1;
int j = 0;
while(j < n)
{
if(k == -1 || s[j] == s[k])
{
next[++j] = ++k;
}
else
{
k = next[k];
}
}
}
int KMP(string t, string p)
{
int i = 0; //主串位置
int j = 0; //模式串位置
vector<int> next(p.size() + 1, -1);
buildnext(p, next, p.size());
for (auto it : next)
cout<<it<<" ";
cout<<endl;
int tsize = t.size(); //这个地方size()需要转化,不然后面while循环会突然退出
int psize = p.size();
while (i < tsize && j < psize )
{
if (j == -1 || t[i] == p[j]) // 当j为-1时,要移动的是i,当然j也要归0
{
i++;
j++;
}
else// i不需要回溯了 i = i - j + 1;
{
j = next[j];
}
}
if (j == p.size())
return i - j;
else
return -1;
}
int main(void)
{
string T = "liqinzhe";
string S = "zh";
cout<< KMP(T, S);
return 0;
}