字符串匹配-KMP算法

本文以通俗易懂的方式介绍了KMP算法的基本原理及实现过程。通过实例详细解释了如何利用next数组避免模式匹配中的回溯操作,提高匹配效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

每次看KMP算法都要像看新知识点一样,故用通俗的语言记录此算法。

KMP算法是保存前缀数组next而达到匹配过程中不回溯指针,提高时间效率的目的。

先举例,

i指针记录主串下标; j指针记录模式串下标

   i=2 3 4 5 6

a b a b c a b c a b c a c b a b

      a b c a c

   j=0 1 2 3 4

S[6]!=T[4], 由于T[0]=T[3],且为abca这个串的相等前缀和后缀的最大长度(即ab!=ca),故下趟比较为下图


a b a b c a b c a b c a c b a b

               a b(从此处开始比较即可)

该算法的关键在于如何求取next数组?

        next[j]=k:代表T[0].....T[k-1]=T[j-k]……T[j-1],

                      表明当模式中T[j]与主串中相应字符不相等时,T[next[j]]重新与主串中字符进行匹配

int* getNext(char *needle)
{
int len=strlen(needle);
int i=0;
int *next=new int[len];
next[0]=-1;
int k=-1;
while(i<len)
{
if( k==-1 || needle[k]==needle[i])
{
++k;
++i;
next[i]=k;
}
else
{
k=next[k];//此处可以理解为不匹配时,则模式串回到next[k]的位置重新比较
}
}
return next;
}

匹配函数

int strStr(char *haystack,char *needle)
{
   int lenOfHaystack=strlen(haystack);
int lenOfNeedle=strlen(needle);
int *next=new int[lenOfNeedle];
next=getNext(needle);
if(lenOfHaystack<lenOfNeedle)
return 0;
if(lenOfHaystack==0)
return 0;
if(lenOfNeedle==0)
return 0;
int res=-1;
int h=0;
int n=0;
while(h<lenOfHaystack && n<lenOfNeedle)
{
if(n==-1 || haystack[h] == needle[n])
{
if(res == -1)
{
res=h;
}
++h;
++n;
}
else
{
n=next[n];
res=-1;
}
}


if(n>=lenOfNeedle)
{
return res;
}
else
return 0;
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值