记得之前在学校ACM月塞上曾经死于字符串匹配题目,因此去学习了KMP算法,前几天去面试一个嵌入式岗位又遇字符串匹配问题,当时想用KMP算法去解,结果憋了好久才憋出来,感觉还不一定正确,还好面试官没看就说他们板子没那么大空间,来个简单粗暴的节约空间的算法,代码要简洁明了,后来就用了朴素匹配算法通过。
扯远了,KMP的介绍网上一大堆了,也都写得比我好,我就不重复造轮子了,直接上代码,顺带附上我觉得很不错的讲解链接:
JULY大神的算法讲解:http://blog.youkuaiyun.com/v_JULY_v/archive/2011/01/01/6111565.aspx
当然如果你想快速使用的话,可以参考下我的代码,不过还是建议弄懂KMP的思想,直接上代码咯,简单粗暴:
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
//#define DEBUG 1
/*
* next数组用于模式串和主串匹配失配时,模式串回退到特定的位置,
* 而主串不必回退,大大提高匹配效率,其中特定位置由next数组保存。
* 生成next数组,其中数组元素值的含义:
* 下 标: 0 1 2 3 4 5 6 7 8 9
* 字 符 串: a a b a a b c a a d
* next数组值: -1 0 -1 0 1 2 -1 0 1 -1
* next[m]表示,匹配到该字符pattern[m+1]失配时,模式串必须回退到next[m]+1的下标位置继续匹配;
* next生成原理:next[m+1](m=0,1,2,...,patter_len - 1)的值为next[n] + 1,其中n使pattern[m + 1] == pattern[next[n]+1]成立,
* n的取值next[m],next[next[m]],next[next[next[m]]]....,-1
* 例子:
* 在求next[5]时,next[4] = 1, pattern[1+1] = 'b', 刚好等于pattern[5],则next[5]=next[4]+1 = 2;
* 在求next[6]时,next[5] = 2, 而pattern[2+1] = 'a', 不等于pattern[6],继续比较,next[2] = -1,由于next[2]的值已经为-1,则next[6] = -1
*/
void generate_next_array(const char *pattern, int *next, int len)
{
int i, j;
next[0] = -1;
for (i = 1; i < len; ++i) {
j = next[i - 1];
while (j >= 0 && pattern[i] != pattern[j + 1])
j = next[j];
if (pattern[i] == pattern[j + 1])
++j;
next[i] = j;
}
#ifdef DEBUG
for (i = 0; i < len; ++i)
printf("%d ", next[i]);
putchar('\n');
#endif
}
void kmp_find(const char *target, const char *pattern)
{
if (NULL == target || NULL == pattern)
return;
int len_pattern = strlen(pattern);
int *next = (int*) malloc(len_pattern * sizeof(int));
generate_next_array(pattern, next, len_pattern);
int i, j;
int len_target = strlen(target);
for (i = 0, j = -1; i < len_target; ++i) {
while (j >= 0 && target[i] != pattern[j + 1])
j = next[j];
if (target[i] == pattern[j + 1])
j++;
//找到匹配的位置,可能有多个匹配位置,若要继续查找,让j=next[j],否则直接break
if (j == len_pattern - 1) {
printf("pos: %d\n", i - len_pattern + 1);
j = next[j];
}
}
free(next);
}
int main()
{
char target[] = "aaaaaabbbaaaabaaaaaab";
char pattern[] = "aab";
kmp_find(target, pattern);
return 0;
}