BF(Brute Force)算法是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配,若相等,则继续比较S的第二个字符和 T的第二个字符;若不相等,则比较S的第二个字符和T的第一个字符,依次比较下去,直到得出最后的匹配结果。
int bf(const char *s,const char *p,int pos)
{
int s_length = strlen(s);
int p_length = strlen(p);
int i = pos;
int j = 0;
while(i < s_length && j < p_length)
{
if(s[i] == p[j])
{
i++;
j++;
}
else
{
i = i - j + 1;
j = 0;
}
}
if(j == p_length)
{
return i - j;
}
else
{
return -1;
}
}
KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt同时发现,因此人们称它为克努特——莫里斯——普拉特操作(简称KMP算法)。KMP算法的关键是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是实现一个next()函数,函数本身包含了模式串的局部匹配信息。时间复杂度O(m+n)。
void getNext(const char *p,int *next);
int kmp(const char *s,const char *p,int pos);
int main()
{
const char *s = "asdfghjklqweerrtttttey";
const char *p = "weerrt";
int pos = kmp(s, p, 0);
if(pos == -1)
{
printf("未匹配成功\n");
}
else
{
printf("匹配成功,位置%d,%s\n",pos,s+pos);
}
return 0;
}
void getNext(const char *p,int *next)
{
next[0] = -1;
next[1] = 0;
int k = 0;
int i = 2;
while(i < strlen(p))
{
if(k == -1 || p[k] == p[i - 1])
{
next[i] = k + 1;
k++;
i++;
}
else
{
k = next[k];
}
}
}
int kmp(const char *s,const char *p,int pos)
{
int slen = strlen(s);
int plen = strlen(p);
int i = pos, j = 0;
int *next = (int *)malloc(sizeof(int) * plen);
assert(next != NULL);
memset(next,0,sizeof(int)*plen);
getNext(p, next);
int m = 0;
for(m = 0; m < plen; ++m)
{
printf("%d ", next[m]);
}
printf("\n");
while(i < slen && j < plen)
{
if(j == -1 || s[i] == p[j])
{
i++;
j++;
}
else
{
j = next[j];
}
}
if(j >= plen)
{
return i-j;
}
return -1;
}