KMP算法：线性时间O(n)字符串匹配算法

qingdujun

已于 2023-07-16 22:43:13 修改

阅读量2.8k

点赞数 3

CC 4.0 BY-SA版权

文章标签： KMP算法前后缀NEXT计算部分匹配表

于 2018-12-27 23:39:02 首次发布

本文链接：https://blog.youkuaiyun.com/qingdujun/article/details/85281936

本文介绍了KMP算法，重点在于理解部分匹配表的计算及其在失配时如何快速滑动字符串。通过实例解析了如何手动求解部分匹配表，并探讨了算法的实现和分析，包括递归过程。最后提到了两种快速计算部分匹配表的方法，适用于学习和考试场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

我自己搭建了博客，以后可能不太在优快云上发博文了，https://www.qingdujun.com/ 。

我在拜读阮一峰老师的这篇文章《字符串匹配的KMP算法》时，最大收获当属手动求部分匹配表的这个例子，（我把它搬过来了，大伙感受一下）——字符串为 $P = A BC D A B D$ 。

字符串	前缀	后缀	部分匹配表
A	NULL	NULL	NEXT[0]=0
AB	A	B	NEXT[1]=0
ABC	A, AB	BC, C	NEXT[2]=0
ABCD	A, AB, ABC	BCD, CD, D	NEXT[3]=0
ABCDA	A, AB, ABC, ABCD	BCDA, CDA, DA, A	NEXT[4]=1
ABCDAB	A, AB, ABC, ABCD, ABCDA	BCDAB, CDAB, DAB, AB, B	NEXT[5]=2
ABCDABD	A, AB, ABC, ABCD, ABCDA, ABCDAB	BCDABD, CDABD, DABD, ABD, BD, D	NEXT[6]=0

（阮一峰老师的这篇文章，基本上是国内网上讲解KMP算法的开山之作了。其特点简短精悍，又能快速让你明白什么KMP算法、什么是部分匹配表）

此时，你应该可以根据前、后缀的概念，手动求出部分匹配表NEXT[*]。不妨试试下面这个例子（该例子摘自《算法导论》）——字符串 $P = ababa c a$ 。
在这里插入图片描述
其中，q表示索引号，string表示字符串，next[7]则为字符串对应的部分匹配表。你的结果与上述表格中的一样吗？

问题1：你可能对NEXT[0]=-1? or 0有所疑惑！

《算法导论》一书上由于下标是从1开始，所以书中NEXT[*]存放的内容为前缀的长度（也同样是下标），而计算机程序下标一般是从0开始，那么长度与下标就相差了一个1。下文为了与《算法导论》一致，也采用了长度（非下标）的存储方式，也就是说部分匹配表中不会出现-1类似的字眼（因为前缀长度>=0）。但这样做是值得的，至少NEXT[*]与《算法导论》一致，也与考试答案一致。

（我看到网上流传的相关KMP文章，NEXT[*]各有不同。本文的举例来自于《算法导论》一书，且我无一字更改，所以例子的正确性能得到保证）