KMP算法关键点解释

最新推荐文章于 2021-09-13 16:52:49 发布

原创最新推荐文章于 2021-09-13 16:52:49 发布 · 346 阅读

CC 4.0 BY-SA版权

15 篇文章

订阅专栏

KMP算法通过已匹配模式串子串的最大前后缀避免了模式串指针回溯，提高了字符串匹配效率。当出现失配时，算法查找最长前后缀以确定模式串指针的移动，减少了不必要的匹配。next[]数组用于记录已匹配前缀的下一个位置，帮助快速定位。通过不断应用查找最长前后缀的规则，最终完成匹配。

在这里插入图片描述 KMP算法的优点是通过证明了已匹配模式串子串的最大前后缀来保证模式串指针j可以不用回到初始位置，算法时间复杂度从O（lenT*lenP）简化成了O(lenT+lenP)

T:G T G T G
P:G T G T G 1
P:  G T G T G 2
P:    G T G T G 3
P:      G T G T G 4
...

我们的比较是通过让第k次BF算法移动的模式串和第1次模式串公共部分进行比较从而间接让第k次的模式串和T串的公共部分进行比较，从而得到最大匹配子串，也就是最大前后缀子串，最后得到next[j]的值。

通过观察可以看到已匹配串最大前后缀是GTG

将j移动到公共部分之后的位置，i停留在失配的位置，继续匹配
按照上面的查找最长前后缀跳转j的规律匹配下去，最终匹配成功
next[j],篇幅长，回头再说
要让机器去寻找j的下一个位置并非容易的事，next[]是一个一维整型数组，数组的下标代表了“已匹配前缀的下一个位置”，元素的值则是“最长可匹配前缀子串的下一个位置”。
规定
next[0]和next[1]的值是0，因为这时候不存在前缀子串，因此k=0
如果P[j]==P[k]，next[j+1]=next[j]+1=k+1
如果P[j]!=P[k],next[j+1]=next[k]+1=next[next[j]]+1