KMP算法是一种改进的字符串匹配算法,KMP算法的关键是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是实现一个next()函数,函数本身包含了模式串的局部匹配信息。因此我们的的模板也就分为两部分;
1;实现next,求出各自部分匹配值
"部分匹配值"就是"前缀"和"后缀"的最长的共有元素的长度
"前缀"指除了最后一个字符以外,一个字符串的全部头部组合;
"后缀"指除了第一个字符以外,一个字符串的全部尾部组合;
代码实现;
void compute_prefix(int *next, char *p)
{
int i, n, k;
n = strlen(p);
next[1] = next[0] = 0;
//printf("0-----%d\n",0);
//printf("1-----%d\n",0);
k = 0; /* 第i次迭代开始之前,k表示next[i-1]的值 */
for (i = 2; i <= n; i++) { //i可以达到n;
while(k != 0 && p[k] != p[i-1])
k = next[k];
if (p[k] == p[i-1]) k++;
next[i] = k;
///printf("%d-----%d\n",i,k);
}
}
除开那个while其他的应该比较好理解;
while 循环只要考虑的是ABACBBBABAB这种情况;
A B A C B B B A B A B
0 0 1 0 0 0 0 1 2 3 ?;
进入while循环找到next[3]=1;再比较p【1】与B是否相同;
等到B的部分匹配值是2;而不是从0开始比较的;
while循环就是这种有相同的字符的;
2;还有一部分就是查找了;
这个容易理解;直接看代码;
void kmp_match(char *text, char *p, int *next)
{
int l=0,m, n, s, q;
m = strlen(p);
n = strlen(text);
q = s = 0; /* q表示上一次迭代匹配了多少个字符,
s表示这次迭代从text的哪个字符开始比较 */
while (s < n) {
q = next[q];
while(q < m && p[q] == text[s]){
q++;
s++;
}
if (q == 0) s++;
else if (q == m) {
printf("移动多少单位 %d\n", s-m);
l++;
}
}
printf("有多少个字串%d\n",l);
}
3看个例题;hdu2078
链接;http://acm.hdu.edu.cn/showproblem.php?pid=2087
代码
#include<stdio.h>
#include<string.h>
void compute_prefix(int *next, char *p)
{
int i, n, k;
n = strlen(p);
next[1] = next[0] = 0;
//printf("0-----%d\n",0);
//printf("1-----%d\n",0);
k = 0; /* 第i次迭代开始之前,k表示next[i-1]的值 */
for (i = 2; i <= n; i++) { //i可以达到n;
while(k != 0 && p[k] != p[i-1])
k = next[k];
if (p[k] == p[i-1]) k++;
next[i] = k;
///printf("%d-----%d\n",i,k);
}
}
void kmp_match(char *text, char *p, int *next)
{
int l=0,m, n, s, q;
m = strlen(p);
n = strlen(text);
q = s = 0; /* q表示上一次迭代匹配了多少个字符,
s表示这次迭代从text的哪个字符开始比较 */
while (s < n) {
q = next[q];
while(q < m && p[q] == text[s]){
q++;
s++;
}
if (q == 0) s++;
else if (q == m) {
l++;
s=s+m-1;
}
}
printf("%d\n",l);
}
int main()
{
int next[1008]={0}, n;
char p[1008]={0};
char text[1008]={0};
while(scanf("%s",text) !=NULL&&strcmp(text,"#")!=0){
scanf("%s",p);
compute_prefix(next, p);
kmp_match(text, p, next);
memset(next,0,sizeof(next));
}
return 0;
}