KMP算法

最新推荐文章于 2024-11-16 09:45:51 发布

原创最新推荐文章于 2024-11-16 09:45:51 发布 · 978 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #数据结构 #string #c

数据结构和算法专栏收录该内容

14 篇文章

订阅专栏

初看kmp算法的时候有点模糊，第一次就根本没明白过。
仔细的推敲。找相关类似的问题。现在把源程序贴出来供大家参考。
关键一点就是要了解next函数的构造，以及为什么要这么做。
在数据结构81页中的next推倒，不过不是很好理解。
其中next是按1开始。伪代码的写法

演示下推导的思路(按书上的从1开始的next求法)：

j             | 1 2 3 4 5 6 7   8
---------------------------------------------
模式串   |  a b  a  a b  c  a   c
next[j]    |  0 1  1 2 2  3  1   2
其中j=1时,是第一个字符'a' 而a前面没有匹配的字符所以next[1]=0;
当 j=2时,是第二个字符'b',而b前面只有一个字符,'a',a又是第一个字符不能和自己匹配,所以next[2]=1;
当j=3时,是第三个字符'a', 前面的b和第一个字符a不匹配,所以next[3]=1;
当j=4时,是第四个字符'a',它前面的字符是a,和第一个字符a是匹配的,所以+1
得到next[4]=2;
同理,j=5时,前面是a.和第一个字符还是匹配的.next[5]=2 ,//(一个字符长度+向前面移动一个单位)
j=6时,前面字符是abaab可以取到最长的子串是ab与第一个字符开始匹配,匹配成功next[6]=3 //最长子串长2+向前移动1个单位得到3
结合这,把83页get_next()函数仔细的把数带进去推一次就不会那么模糊了

#include<stdio.h>
#include<string.h>
#include<conio.h>
#define  MAX  250
void get_next(const char *T,int *next)//next
{
    int i=0,j=-1;
    next[0] = -1; //next[0] = -1 跟数组下表相配套，从0开始
    while(i < strlen(T))
    {
        if(j == -1 || T[i] == T[j])
        {
            ++i;
            ++j;
            next[i] = j;
        }
        else
        {
            j=next[j];
        }
    }
}
int Index_KMP(const char *S, const char *T)//KMP
{
    int i=0, j=0;
    int next[MAX];
    get_next(T,next);
    while(i < strlen(S) && j < strlen(T))
    {
        if(j == 0 || S[i] == T[j])
        {
            ++i;
            ++j;
        }
        else
        {
            j = next[j];
        }
    }
    if(j >= strlen(T)) return i-strlen(T);
    else return 0;
}
void main()
{
    int pos;
    char str1[MAX];//主串
    char str2[MAX];//模式串
    printf("input first string:");
    gets(str1);
    printf("input second string:");
    gets(str2);
    pos=Index_KMP(str1,str2);
    printf("匹配位置在主串第%d个字符之后的位置",pos);
    getch();
}