KMP

最新推荐文章于 2018-06-26 16:15:13 发布

weixin_34400525

最新推荐文章于 2018-06-26 16:15:13 发布

阅读量48

点赞数

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/Lune-Qiu/p/9150576.html

本文详细介绍了KMP算法的原理及实现过程，包括Next数组的计算方法及其在字符串匹配中的应用。通过实例演示了如何利用KMP算法高效地完成字符串搜索。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

strstr：一个字符串在另一个字符串中出现的位置。

我们将第一个字符串称为匹配串，第二个字符串称为主串

在整个KMP过程中主串不回头（即向后走或者停止）

KMP中最终要的环节就是Next数组：

根据前缀，和后缀，找到最大相同的串即该位的next数组值。

举个例子：（字符串的前缀和后缀不能为本身）

匹配串：abcab 前缀：a ab abc abca (以头开始)

　　　　　　　后缀：b ab cab bcab（以尾结束）

　　　　该串的最大相等长度为ab 为 2。

　　　　a b c a b c d a b c a b c f

　　　　0 0 0 1 2 3 0 1 2 3 4 5 6 0

　　　　求next数组主要分为3步

　　　　　　j = i-1

　　　　str[i] 与 str[next[j]]

　　　　1. 相等 next[i] = next[j]+1;

　　　　2.不相等且 next[i-1] = 0 (说明和第一个比较过了,与前面的字符串没有相等的可能) 例如：下标为2的c，与下标为0的a比较，不相等，next[2] = 0;

　　　　　　　　　　 next[i] = 0;

　　　　3.不满足1,2 不相等并且next[j] != 0 例如：f先与下标为6的d比较不相等，再与下标为3的a比较不相等，next[2]为0，所以f位为0

　　　　　　　　　　j = next[j] - 1;

　　　　重复上述过程，遍历字符串　　　　

getNext函数：

int* GetNext(char* st)
{
    int len = strlen(st);
    int* next = (int*)malloc(sizeof(int)*len);
    memset(next,0,sizeof(next));
    int i = 1;
    int j = i-1;    

    while(i<len)
    {
        if(st[i] == st[next[j]])
        {
            next[i] = next[j]+1;
            i++;
            j = i-1;
        }
        else if(next[j] == 0)
        {
            next[i] = 0;
            i++;
            j = i-1;
        }
        else
        {
            j = next[j]-1;
        }
    }
    return next;
}

KMP代码：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int* GetNext(char* st)
{
    int len = strlen(st);
    int* next = (int*)malloc(sizeof(int)*len);
    memset(next,0,sizeof(next));
    int i = 1;
    int j = i-1;

    while(i<len)
    {
        if(st[i] == st[next[j]])
        {
            next[i] = next[j]+1;
            i++;
            j = i-1;
        }
        else if(next[j] == 0)
        {
            next[i] = 0;
            i++;
            j = i-1;
        }
        else
        {
            j = next[j]-1;
        }
    }
    return next;
}
int KMP(char* str,char* st,int* next)
{
    int mark1 = 0;
    int mark2 = 0;
    int len1 = strlen(str);
    int len2 = strlen(st);
    while(mark1<len1 && mark2 < len2)
    {
        if(str[mark1] == st[mark2])//相等
        {
            mark1++;
            mark2++;
        }
        else//不相等
        {
            if(mark2 == 0)//匹配串的第一个与主串不相等那么主串向后走
                mark1++;
            else
                mark2 = next[mark2-1];//匹配串跳到前一个下标的next值位置
                //(mark2:我和你不相等，但当初我和next[mark-1]的位置比较时也不相等，你去看看你俩相不相等，相等的话就从那个位置继续向下比)
        }
    }
    if(mark2 == len2)//匹配串到了最后说明找到了
        return mark1-mark2;
    if(mark1 == len1)//主串找到最后说明没找到
        return -1;
}
int main()
{
   // char* str = "abcabceabcabcdabcabcabcabcdabcabcfabc";
   // char* st = "abcabcdabcabcf";
   char* str = "abcabceabcabcdabcabcdabcabcfabc";
   char* st = "abcabcdabcabcf";
    int p ;
    int* next = GetNext(st);
    int len1 = strlen(st);

    p = KMP(str,st,next);
    printf("%d",p);
}