KMP算法详解

最新推荐文章于 2025-10-10 15:24:08 发布

原创最新推荐文章于 2025-10-10 15:24:08 发布 · 1.9k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#kmp

-------------字符串------------- 专栏收录该内容

16 篇文章

订阅专栏

KMP

KMP算法是一种改进的字符串匹配算法，由D.E.Knuth，J.H.Morris和V.R.Pratt同时发现，因此人们称它为克努特——莫里斯——普

拉特操作（简称KMP算法）。KMP算法的关键是利用匹配失败后的信息，尽量减少模式串与主串的匹配次数以达到快速匹配的目

的。具体实现就是实现一个next()函数，函数本身包含了模式串的局部匹配信息。

接下来我们先分析三张图，S代表主串，T代表模式串。

当主串 S[i ]与子串T[ j ]失配时，i不回溯，仅j回溯到一个尽量“偏右”的位置k。因此 KPM算法的核心问题是寻找确定k=next[ j ]的

方法。

（1）（2）（3）

由 (I) ，(II)，和 (III) 我们得到：

T[0 ... k -1] = T[ j - k ... j -1] ＝ T[0 ... next[ j ] -1]

因此得到 k = next [ j ] 的定义(注意下标范围)

以上定义也说明next [j]与主串S无关。

next[ j ]函数举例

kmp算法：

void kmp(int *S,int *T){  
    int i = 0,j = 0;
    getnext(T,next);  
    while(i < n){
        if(j == -1 || S[i] == T[j]){
            i++;
            j++;
        }
        else
            j = next[j];  
        if(j == m){
            printf("%d\n",i-m+1);  
            return ;  
        }  
    }  
    printf("-1\n");  
}

——根据定义 next[0] = -1;

——设 next[j] = k，求 next[j+1]

若 T[j] = T[k]，则 next[j+1] = k + 1 = next[j] + 1;

否则(T[j] !=T[k])，

若T[[j] = T[next[k]], 则 next[j+1] = next[k] + 1;
否则......

next[ j ]函数：

void getnext(int *T,int *next){
    int j = 0,k = -1;
    next[0] = -1;    
    while(j < m){
        if(k == -1 || T[j] == T[k]){
            j++; k++;
            next[j] = k;    
        }
        else
            k = next[k];
    }
}

运用KMP算法的匹配过程

第1趟目标 a c a b a a b aa b c a c aa b c

模式 a b aa b c a c

j = 1 ->j=f (j-1)+1 = 0

第2趟目标 a c a b aa b aa b c a c aa b c

模式 a ba a b c a c

j = 5 ->j =f(j-1)+1= 2

第3趟目标a c a b aa b aa b c a c aa b c

模式 (a b)aa b c a c