字符串匹配神器----KMP算法

  记得之前在学校ACM月塞上曾经死于字符串匹配题目,因此去学习了KMP算法,前几天去面试一个嵌入式岗位又遇字符串匹配问题,当时想用KMP算法去解,结果憋了好久才憋出来,感觉还不一定正确,还好面试官没看就说他们板子没那么大空间,来个简单粗暴的节约空间的算法,代码要简洁明了,后来就用了朴素匹配算法通过。

  扯远了,KMP的介绍网上一大堆了,也都写得比我好,我就不重复造轮子了,直接上代码,顺带附上我觉得很不错的讲解链接:

 JULY大神的算法讲解:http://blog.youkuaiyun.com/v_JULY_v/archive/2011/01/01/6111565.aspx 

 当然如果你想快速使用的话,可以参考下我的代码,不过还是建议弄懂KMP的思想,直接上代码咯,简单粗暴:

#include <stdio.h>
#include <string.h>
#include <stdlib.h>
//#define DEBUG 1

/*
* next数组用于模式串和主串匹配失配时,模式串回退到特定的位置,
* 而主串不必回退,大大提高匹配效率,其中特定位置由next数组保存。
* 生成next数组,其中数组元素值的含义:
* 下      标:  0  1  2  3  4  5  6  7  8  9
* 字  符  串:  a  a  b  a  a  b  c  a  a  d
* next数组值: -1  0 -1  0  1  2 -1  0  1 -1
* next[m]表示,匹配到该字符pattern[m+1]失配时,模式串必须回退到next[m]+1的下标位置继续匹配;
* next生成原理:next[m+1](m=0,1,2,...,patter_len - 1)的值为next[n] + 1,其中n使pattern[m + 1] == pattern[next[n]+1]成立,
* n的取值next[m],next[next[m]],next[next[next[m]]]....,-1
* 例子:
* 在求next[5]时,next[4] = 1, pattern[1+1] = 'b', 刚好等于pattern[5],则next[5]=next[4]+1 = 2;
* 在求next[6]时,next[5] = 2, 而pattern[2+1] = 'a', 不等于pattern[6],继续比较,next[2] = -1,由于next[2]的值已经为-1,则next[6] = -1
*/
void generate_next_array(const char *pattern, int *next, int len)
{
	int i, j;

	next[0] = -1;
	for (i = 1; i < len; ++i) {
		j = next[i - 1];
		while (j >= 0 && pattern[i] != pattern[j + 1])
			j = next[j];
		if (pattern[i] == pattern[j + 1])
			++j;
		next[i] = j;
	}

#ifdef DEBUG
	for (i = 0; i < len; ++i)
		printf("%d ", next[i]);
	putchar('\n');
#endif
}

void kmp_find(const char *target, const char *pattern)
{
	if (NULL == target || NULL == pattern)
		return;

	int len_pattern = strlen(pattern);
	int *next = (int*) malloc(len_pattern * sizeof(int));
	generate_next_array(pattern, next, len_pattern);

	int i, j;
	int len_target = strlen(target);
	for (i = 0, j = -1; i < len_target; ++i) {
		while (j >= 0 && target[i] != pattern[j + 1])
			j = next[j];
		if (target[i] == pattern[j + 1])
			j++;
		
		//找到匹配的位置,可能有多个匹配位置,若要继续查找,让j=next[j],否则直接break
		if (j == len_pattern - 1) {
			printf("pos: %d\n", i - len_pattern + 1);
			j = next[j];
		}
	}

	free(next);
}

int main()
{
	char target[] = "aaaaaabbbaaaabaaaaaab";
	char pattern[] = "aab";
	kmp_find(target, pattern);

	return 0;
}




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值