KMP算法的next函数详解

本文深入解析KMP算法中next数组的构建过程,阐述其在字符串匹配中的应用原理,并通过实例帮助理解递推逻辑。

   不得不说,KMP的next函数是在是难以理解,智商拙计。在几天的断断续续理解之后一度想放弃,在得知了它的别名看毛片后重新提起了兴趣。

    KMP算法理解的难点在于next递推的理解,也就是说当next[j] = k的时候,如何求出next[j+1]的值。

    先解释一下next[j] = k的意义。这说明在子串中该j位置前,有一个从头开始向后k长度的序列,与从尾部开始向前k长度的序列完全相同,且不存在k'>k,即k是长度最大的。有了这个next[j]之后,在匹配的时候前面的k序列无法继续匹配时,可直接将子串向后滑动,这时使尾部向前看的k序列替代之前从头开始的那部分k序列,即可利用到之前匹配的信息,指向母串的指针也不需要回溯。

    要求next[j+1],则分为两种情况

    1.前缀k序列的下一个字符和后缀的k序列的下一个字符相同

       不用解释,next[j+1]=k+1;

    2.前缀k序列的下一个字符和后缀的k序列的下一个字符不相同

       则我们将前缀k序列和后缀的k序列进行拆分,因为他们也是有自己的前缀和后缀序列k11和k12的,这时候,其实比较的是前缀k的前缀即k11和后缀k的后缀k12的,他们肯定相同,那么只需要比较k11的下一个字符和k12的下一个字符(也就是后缀的k序列的下一个字符)。如果相同那么可以知道,next[j] = next[next[k]]+1;如果不同则继续迭代,直到迭代到第一个字符。

  1. void Next(int *next, char *p) //定义next数组和模式串p 
  2. {  
  3.     int i, n, k;  
  4.     n = strlen(p);            //求出模式串长度
  5.     next[0] = next[1] = -1;   //定义第一个字符next为0
  6.     k = 0;                    //k表示next[i-1]的值     
  7.     for (i = 2; i <= n; i++) 
  8.     {           while(k != 0 && p[k] != p[i-1])
    {
    k = next[k];
    }
                    if (p[k] == p[i-1])
        k++;  
                    next[i] = k;  
             }  
  9. }  

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值