终极KMP
终极的KMP,这次我要彻底的理解KMP
KMP真的是学习tg中的一个瓶颈
KMP的所有博客,无论是百度的,洛谷的,我都不会,肯定是我太垃圾了,不过没关系,我这次要来个终极笔记,彻底弄明白
是个狗都知道,KMP的算法就是利用失配next数组来达到这么个算法
KMP到底是用来干什么的,作为菜鸡的我,很想用一句话来总结每一个算法的作用及应用
KMP,是做字符串的匹配问题的
文本串,a a b a a b a a f
模式串,a a b a a f
我们要求的是文本串中是否出现了模式串
这是一个KMP最经典的问题
暴力的做法,我在普通KMP中也已经说明了,两层循环朴素比较,知道比较完成
这种做法无论是什么垃圾题都不会水过
如果用KMP,比如我们匹配到了f,那么我们不会从头比较,而是从匹配过的
b a a f从失配的地方开始
那么我们为什么从b开始
这就是KMP的瓶颈和核心了
因为我们从最长前后缀的下一个开始
什么意思,能不能说人话
我们看
a a b a a b a a f
a a b a a f
我们在f这里失配了,那么我们从f前面找一个既是前缀又是后缀的串,并且是最长的,找到了aa,因为要从这个串的后面比较,所以从b开始(这句话是在日照cwk给我讲的,现在明白了)
这个东西叫做前缀表
前缀表next
这是kmp的精髓
是kmp的核心
也是kmp最难理解的部分
前缀,包含首字母,不包含尾字母的所有字串
后缀,包含尾字母,不包含首字母的所有字串
这里强调我们求的是最长的相等前缀和后缀
前缀表的内部存储:
a 0
aa 1
aab 0
aaba 1
aabaa 2
aabaaf 0
这就是前缀表
我们如何利用前缀表进行匹配?
?????
如果我们在f这个位置失配了,那么就得从aabaa找最长前缀后缀,那么就是前缀表的2,那么我们从最长前缀后缀的下一个,那么就是从a[3]开始
继续匹配
他好像真的想把我讲懂
我真的懂了!!
前缀表,就是next数组,或者说kmp数组
那么怎么求next数组,只需要自己对自己匹配就完了!
#include<iostream>//手动模拟程序,人脑DEV
#include<cstdio>
#include<algorithm>
#include<string>
#include<cstring>
#include<cmath>
#define maxn 1000010
using namespace std;
int kmp[maxn];
int la,lb;
int j;
char a[maxn],b[maxn];
int main()
{
cin>>a+1;//aabaabaaf
cin>>b+1;//aabaaff
la=strlen(a+1);//9
lb=strlen(b+1);//7
for(int i=2;i<=lb;i++)//忽略第一位
{
while(j&&b[i]!=b[j+1]) j=kmp[j];//0 0 0 0
if(b[j+1]==b[i]) j++;//0 0 1 2 寻找相同的前缀后缀
kmp[i]=j;//0 0 1 2
}
j=0;
for(int i=1;i<=la;i++)
{
while(j>0&&b[j+1]!=a[i])
j=kmp[j];
if(b[j+1]==a[i])
j++;
if(j==lb)
{
cout<<i-lb+1<<endl;
j=kmp[j];//回跳
}
}
for(int i=1;i<=lb;i++)
{
cout<<kmp[i]<<" ";//模式串输出
}
return 0;
}
理解KMP算法:从零到精通
153

被折叠的 条评论
为什么被折叠?



