KMP

本文详细介绍了KMP算法的原理及实现过程,包括Next数组的计算方法及其在字符串匹配中的应用。通过实例演示了如何利用KMP算法高效地完成字符串搜索。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

strstr:一个字符串在另一个字符串中出现的位置。

我们将第一个字符串称为匹配串,第二个字符串称为主串

在整个KMP过程中主串不回头(即向后走或者停止)

KMP中最终要的环节就是Next数组:

根据前缀,和后缀,找到最大相同的串即该位的next数组值。

举个例子:(字符串的前缀和后缀不能为本身)

匹配串:abcab  前缀:a ab abc abca (以头开始)

        后缀:b ab cab bcab(以尾结束)

    该串的最大相等长度为ab 为 2。

    a  b  c  a  b  c  d  a  b  c  a  b  c  f 

    0  0  0  1  2  3  0  1  2  3  4  5  6 0

    求next数组主要分为3步

      j = i-1

    str[i] 与 str[next[j]]

    1. 相等   next[i] = next[j]+1;

    2.不相等  且 next[i-1] = 0 (说明和第一个比较过了,与前面的字符串没有相等的可能)  例如:下标为2的c,与下标为0的a比较,不相等,next[2] = 0;

           next[i] = 0;

    3.不满足1,2  不相等并且next[j] != 0     例如:f先与下标为6的d比较不相等,再与下标为3的a比较不相等,next[2]为0,所以f位为0

          j = next[j] - 1;

    重复上述过程,遍历字符串    

getNext函数:

int* GetNext(char* st)
{
    int len = strlen(st);
    int* next = (int*)malloc(sizeof(int)*len);
    memset(next,0,sizeof(next));
    int i = 1;
    int j = i-1;    

    while(i<len)
    {
        if(st[i] == st[next[j]])
        {
            next[i] = next[j]+1;
            i++;
            j = i-1;
        }
        else if(next[j] == 0)
        {
            next[i] = 0;
            i++;
            j = i-1;
        }
        else
        {
            j = next[j]-1;
        }
    }
    return next;
}

KMP代码:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int* GetNext(char* st)
{
    int len = strlen(st);
    int* next = (int*)malloc(sizeof(int)*len);
    memset(next,0,sizeof(next));
    int i = 1;
    int j = i-1;

    while(i<len)
    {
        if(st[i] == st[next[j]])
        {
            next[i] = next[j]+1;
            i++;
            j = i-1;
        }
        else if(next[j] == 0)
        {
            next[i] = 0;
            i++;
            j = i-1;
        }
        else
        {
            j = next[j]-1;
        }
    }
    return next;
}
int KMP(char* str,char* st,int* next)
{
    int mark1 = 0;
    int mark2 = 0;
    int len1 = strlen(str);
    int len2 = strlen(st);
    while(mark1<len1 && mark2 < len2)
    {
        if(str[mark1] == st[mark2])//相等
        {
            mark1++;
            mark2++;
        }
        else//不相等
        {
            if(mark2 == 0)//匹配串的第一个与主串不相等那么主串向后走
                mark1++;
            else
                mark2 = next[mark2-1];//匹配串跳到前一个下标的next值位置
                //(mark2:我和你不相等,但当初我和next[mark-1]的位置比较时也不相等,你去看看你俩相不相等,相等的话就从那个位置继续向下比)
        }
    }
    if(mark2 == len2)//匹配串到了最后说明找到了
        return mark1-mark2;
    if(mark1 == len1)//主串找到最后说明没找到
        return -1;
}
int main()
{
   // char* str = "abcabceabcabcdabcabcabcabcdabcabcfabc";
   // char* st = "abcabcdabcabcf";
   char* str = "abcabceabcabcdabcabcdabcabcfabc";
   char* st = "abcabcdabcabcf";
    int p ;
    int* next = GetNext(st);
    int len1 = strlen(st);

    p = KMP(str,st,next);
    printf("%d",p);
}

 

转载于:https://www.cnblogs.com/Lune-Qiu/p/9150576.html

我们这里说的KMP不是拿来放电影的(虽然我很喜欢这个软件),而是一种算法。KMP算法是拿来处理字符串匹配的。换句话说,给你两个字符串,你需要回答,B串是否是A串的子串(A串是否包含B串)。比如,字符串A="I'm matrix67",字符串B="matrix",我们就说B是A的子串。你可以委婉地问你的MM:“假如你要向你喜欢的人表白的话,我的名字是你的告白语中的子串吗?” 解决这类问题,通常我们的方法是枚举从A串的什么位置起开始与B匹配,然后验证是否匹配。假如A串长度为n,B串长度为m,那么这种方法的复杂度是O (mn)的。虽然很多时候复杂度达不到mn(验证时只看头一两个字母就发现不匹配了),但我们有许多“最坏情况”,比如,A= "aaaaaaaaaaaaaaaaaaaaaaaaaab",B="aaaaaaaab"。我们将介绍的是一种最坏情况下O(n)的算法(这里假设 m<=n),即传说中的KMP算法。 之所以叫做KMP,是因为这个算法是由Knuth、Morris、Pratt三个提出来的,取了这三个人的名字的头一个字母。这时,或许你突然明白了AVL 树为什么叫AVL,或者Bellman-Ford为什么中间是一杠不是一个点。有时一个东西有七八个人研究过,那怎么命名呢?通常这个东西干脆就不用人名字命名了,免得发生争议,比如“3x+1问题”。扯远了。 个人认为KMP是最没有必要讲的东西,因为这个东西网上能找到很多资料。但网上的讲法基本上都涉及到“移动(shift)”、“Next函数”等概念,这非常容易产生误解(至少一年半前我看这些资料学习KMP时就没搞清楚)。在这里,我换一种方法来解释KMP算法。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值