终极KMP

理解KMP算法：从零到精通

最新推荐文章于 2025-10-31 23:33:43 发布

原创最新推荐文章于 2025-10-31 23:33:43 发布 · 101 阅读

0 ·

CC 4.0 BY-SA版权

复制代码可以，但一定要独立思考啊啊啊啊啊啊啊！！！！

KMP 专栏收录该内容

6 篇文章

订阅专栏

终极KMP

终极的KMP，这次我要彻底的理解KMP
KMP真的是学习tg中的一个瓶颈
KMP的所有博客，无论是百度的，洛谷的，我都不会，肯定是我太垃圾了，不过没关系，我这次要来个终极笔记，彻底弄明白
是个狗都知道，KMP的算法就是利用失配next数组来达到这么个算法
KMP到底是用来干什么的，作为菜鸡的我，很想用一句话来总结每一个算法的作用及应用
KMP，是做字符串的匹配问题的

文本串，a a b a a b a a f
模式串，a a b a a f
我们要求的是文本串中是否出现了模式串
这是一个KMP最经典的问题
暴力的做法，我在普通KMP中也已经说明了，两层循环朴素比较，知道比较完成
这种做法无论是什么垃圾题都不会水过
如果用KMP，比如我们匹配到了f，那么我们不会从头比较，而是从匹配过的
b a a f从失配的地方开始
那么我们为什么从b开始
这就是KMP的瓶颈和核心了
因为我们从最长前后缀的下一个开始
~~什么意思，能不能说人话~~
我们看
a a b a a b a a f
a a b a a f
我们在f这里失配了，那么我们从f前面找一个既是前缀又是后缀的串，并且是最长的，找到了aa，因为要从这个串的后面比较，所以从b开始（这句话是在日照cwk给我讲的，现在明白了）
这个东西叫做前缀表

前缀表next

这是kmp的精髓
是kmp的核心
也是kmp最难理解的部分
前缀，包含首字母，不包含尾字母的所有字串
后缀，包含尾字母，不包含首字母的所有字串
这里强调我们求的是最长的相等前缀和后缀
前缀表的内部存储：
a 0
aa 1
aab 0
aaba 1
aabaa 2
aabaaf 0
这就是前缀表
我们如何利用前缀表进行匹配？
？？？？？
如果我们在f这个位置失配了，那么就得从aabaa找最长前缀后缀，那么就是前缀表的2，那么我们从最长前缀后缀的下一个，那么就是从a[3]开始
继续匹配
他好像真的想把我讲懂
我真的懂了！！
前缀表，就是next数组，或者说kmp数组
那么怎么求next数组，只需要自己对自己匹配就完了！

#include<iostream>//手动模拟程序，人脑DEV 
#include<cstdio>
#include<algorithm>
#include<string>
#include<cstring>
#include<cmath>
#define maxn 1000010
using namespace std;
int kmp[maxn];
int la,lb;
int j;
char a[maxn],b[maxn];
int main()
{
    cin>>a+1;//aabaabaaf
    cin>>b+1;//aabaaff
    la=strlen(a+1);//9
    lb=strlen(b+1);//7
    for(int i=2;i<=lb;i++)//忽略第一位 
    {
        while(j&&b[i]!=b[j+1]) j=kmp[j];//0 0 0 0
        if(b[j+1]==b[i]) j++;//0 0 1 2    寻找相同的前缀后缀 
        kmp[i]=j;//0 0 1 2
    }
    j=0;
    for(int i=1;i<=la;i++)
    {
        while(j>0&&b[j+1]!=a[i]) 
            j=kmp[j];
        if(b[j+1]==a[i])
            j++;
        if(j==lb) 
        {
            cout<<i-lb+1<<endl;
            j=kmp[j];//回跳
        }
    }
    for(int i=1;i<=lb;i++)
    {
        cout<<kmp[i]<<" ";//模式串输出
    }
    return 0;
}