KMP算法(Knuth-Morris-Pratt Algorithm)的C语言实现加注释

最新推荐文章于 2024-06-02 09:00:00 发布

原创最新推荐文章于 2024-06-02 09:00:00 发布 · 3.4k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#algorithm #算法 #语言 #c #delete #string

本文深入解析了Knuth-Morris-Pratt算法的核心原理，并通过示例代码演示了如何实现该算法。文章详细介绍了算法过程，包括模板匹配、最大后缀计算以及匹配过程中的状态转移，旨在帮助读者掌握字符串匹配技巧。

其实这个算法只要明白了原理就好了，如果不明白过程可以去这个链接看，里面写得很详细。

http://hi.baidu.com/chioyang/blog/item/e8b58f384f51f2c3d56225fb.html

我个人认为，这个算法的过程，你可以当成被匹配的字符串，例如t ,它有一个游标，标记为i, 它是相对模板 p来说是静止不动，模板p也有一个游标，我们假设为q, 如果匹配的话，那么字符串p 与模板 p同时向前移一个字符，如果不匹配的话，那么模板p相对 t移动，用p当前获得的最大后缀去再匹配，这个过程如果理解了的话，那么下面算法的实现可以说是信手拈来。下面给我的代码，注释得不好，希望能帮助你理解。

/* Knuth-Morris-Pratt String Match Algorithm Copyright (C) 2010-**** Long Cheng <fantasywindy@gmail.com> @version 1.1.1-20100714 */ #include <stdio.h> #include <stdlib.h> #include <string.h> void kmp(char *p, char *t) // p是模板，t是需要匹配的字符串 { int m=strlen(p); int n=strlen(t); int i; int *next=new int[m]; int q=0; //q是已经匹配的字符的个数 next[0]=0; for( i=1; i<m; ++i ) //计算模板, next[i]的值是p[0 ~ i] 这个子串的最大后缀的长度 { while( q > 0 && p[q] != p[i] ) //如果当前字符(其实是自己与自己匹配)与p[q]不符的话，那么q换成p[0 ~ q-1]这个索引的字符，即q=next[q-1] { q=next[q-1]; } if( p[q] == p[i] ) //如果当前字符p[i]与p[q]符合，则把自己加进去，即q++,然后把此时的长度值即自加后的q赋给next[i] { ++q; } next[i]=q; } //下面的过程其实跟上面计算模板的next值差不多，只要看懂了上面的，下面其实不难 for (int k=0; k<m; ++k) //输出计算出来的模板 { printf("next[%d]=%d/n",k,next[k]); } q=0; for( i=0; i<n; ++i ) { while( q>0 && p[q] != t[i] ) { q=next[q-1]; } if( p[q] == t[i] ) { ++q; } if( q == m ) //如果匹配的字母数q等于char *p的长度值m的话，证明完全匹配，打印位置信息与字符串，然后再继续q=next[q-1] { printf("find a match in the position %d/n",i-m+1); printf("%s/n",&t[i-m+1]); q=next[q-1]; } } delete [] next; } int main() { char a[100]="you have a new message, the news is hello"; char b[100]="new"; kmp(b,a); return 0; }