KMP算法,是由Knuth,Morris,Pratt共同提出的模式匹配算法,其对于任何模式和目标序列,都可以在线性时间内完成匹配查找,而不会发生退化,是一个非常优秀的模式匹配算法。
/*
* next[]的含义(前提):x[i-next[i]...i-1] = x[0...next[i]-1]这很重要;
* next[i]为满足x[i-z...i-1] = x[0...z-1]的最大值z(就是x的自身匹配);
*/
//求next的代码实现
/*
* next[]求到了next[m],这个next[m]作用还很大;
*/
void kmp_pre(char x[], int m, int next[]) {
int i, j;
j = next[0] = -1;
i = 0;
while (i < m) {
while (-1 != j && x[i] != x[j]) j = next[j];
//j = -1,表示第0位都没匹配成功;那就要直接推进一位;
next[++i] = ++j;
}
}
/*
*还可以有一个小优化;
*/
void preKMP(char x[], int m, int kmpNext[]) {
int i, j;
j = kmpNext[0] = -1;
i = 0;
while (i < m) {
while (-1 != j && x[i] != x[j]) j = kmpNext[j];
if (x[++i] == x[++j]) kmpNext[i] = kmpNext[j];
else kmpNext[i] = j;
/*这个if很6,这除去了一些无意义的next[],大概意思是
*如果x[j]匹配失败了,那么就执行 j = next[j];
*而x[j] = x[next[j]]所以x[next[j]]肯定也会匹配失败。
*所以就说这个next[j]是无意义的。
*/
}
}
/*
*x与y匹配;
*返回x在y中出现的次数,可以重叠
*与求next[]函数的写法基本相似;
*/
int next[10010];
int KMP_Count(char x[], int m, char y[], int n) {
//x是模式串,y是主串;
int i, j;
int ans = 0;
//preKMP(x, m, next);
kmp_pre(x, m, next);
i = j = 0;
while (i < n) {
while (-1 != j && y[i] != x[j]) j = next[j];
i++; j++;
if (j >= m) {
ans++;
j = next[j];
}
}
return ans;
}