前言
本篇文章不阐述KMP算法流程与实现方式,网上有很多对KMP算法进行详细阐述的文章,至于KMP的实现方式,特别推荐刘汝佳版本的KMP算法,简单易懂且易于实现。
本篇文章主要针对常见的KMP问题进行剖析,提供一些思路供反思、参考、交流。
KMP能够解决的问题
KMP可以有效解决大部分单匹配问题,KMP算法的复杂度是O(M+N),这是十分高效的。
KMP核心问题——F数组(NEXT数组)
F数组是整个KMP问题的核心(刘汝佳版本的KMP称为F数组,大部分KMP资料称为NEXT数组)。几乎所有KMP题目都是针对F数组来进行考察。
F数组实质上是针对KMP算法的状态转移图进行的一个诠释,F数组的意义在于某一字符失配以后,跳转到可能匹配的位置继续进行匹配,从而节省了时间。
KMP问题分析思路一——打表找规律
几乎所有的KMP题目都是在F数组上做文章,实际上F数组能做的花样并不是很多,所以将F数组打表,观察样例和表之间的联系,就很有可能找到规律,从而解决问题。
例题一:POJ 2752
问一个字符串,前缀和后缀相同的前缀长度可能是多少?
例如:ababcababababcabab
前缀长度为2 4 9 18时,前缀和后缀长度相同
解题思路:
对于这道题,刚拿到题就开始分析,其实是比较慢的。最佳的方法是将样例的f表打一下,看有什么规律。
打表以后,很容易就能发现f[18]=9,f[9]=4。发现这个规律以后,这道题便迎刃而解。
为了论证打表找规律的实用性,我决定再选择一道题,进行论证和分析。
例题二:POJ 2406
给一个字符串,问这个字符串是由多少个子串循环组成