link: https://www.cnblogs.com/zhangtianq/p/5839909.html
本文对kmp算法不做冗余的说明。
解决的问题: 有一个文本串S,和一个模式串P,现在要查找P在S中的位置,怎么查找呢?
Next数组规则总结:
Next[n]; n = pattern_str.size()
(1) 初始Next[0] 为-1;
(2) 对于第n个字符Next(n), 假设第Next(n-1)=k;
(3) 当k=-1时,则Next(n)=0;
(4) 当k!= -1时;将第n-1个字符与第k字符比较;
(5) 当pattern_str[n-1] == pattern_str[k] 时; Next[n]=Next(n-1) +1;
(6) 当pattern_str[n-1] != pattern_str[k] 时; 令k=Next[k], 重新执行第3步。
代码实现:
void GetNext(char* p,int next[])
{
int pLen = strlen(p);
next[0] = -1;
int k = -1;
int j = 0;
while (j < pLen - 1)
{
if (k == -1 || p[j] == p[k])
{
++k;
++j;
next[j] = k;
}
else
{
k = next[k];
}
}
}
Next 数组的优化; 对于重复字符匹配的模式字符串时,如"aaaah"时,代码优化如下:
//优化过后的next 数组求法
void GetNext(char* p, int next[])
{
int pLen = strlen(p);
next[0] = -1;
int k = -1;
int j = 0;
while (j < pLen - 1)
{
if (k == -1 || p[j] == p[k])
{
++j;
++k;
if (p[j] != p[k])
next[j] = k;
else
next[j] = next[k];
}
else
{
k = next[k];
}
}
}
KMP函数代码:
int KmpSearch(char* s, char* p)
{
int i = 0;
int j = 0;
int sLen = strlen(s);
int pLen = strlen(p);
while (i < sLen && j < pLen)
{
//①如果j = -1,或者当前字符匹配成功(即S[i] == P[j]),都令i++,j++
if (j == -1 || s[i] == p[j])
{
i++;
j++;
}
else
{
//②如果j != -1,且当前字符匹配失败(即S[i] != P[j]),则令 i 不变,j = next[j]
//next[j]即为j所对应的next值
j = next[j];
}
}
if (j == pLen)
return i - j;
else
return -1;
}