KMP(2)

本文介绍了KMP算法中next数组的优化计算方法,通过理解next数组描述的前缀字符串之间的关系,利用最长后缀关系进行递推求解。同时,文章提供了完整的C++代码实现,包括如何在找到一个完整匹配后继续进行KMP匹配,以找出所有可能的匹配位置。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

求next数组(暴力版本)
Next[0] = -1
Next[1] = 0
For i = 2...P.len
    Next[i] = 0;
    For j = i - 1...1
        If P[1...j] == P[i - j + 1...i]//P[1.
### KMP算法的概念 KMP(Knuth-Morris-Pratt)算法是一种高效的字符串匹配算法,用于在一个文本串S里查找一个模式串P的位置。该算法通过预处理模式串构建部分匹配表(Partial Match Table, PMT),也称为`next`数组来减少不必要的字符比较次数[^1]。 ### KMP算法与BF算法的区别 相较于暴力(Brute Force, BF)算法逐位移动并逐一比较的方式,当遇到不匹配情况时,KMP利用已经匹配的信息决定下一次应该跳过多少个字符继续比较而不是简单地将模式串向右滑动一位。这种方式显著提高了效率,尤其是在面对大量重复子结构的情况下。 ### 部分匹配表(Next数组) #### Next数组的作用 为了实现上述功能,KMP引入了一个重要的辅助数据结构——`next`数组。这个数组记录着对于给定长度的前缀,在发生失配之后应当转移到哪个状态去尝试重新匹配下一个可能的成功位置。具体来说: - 对于任意索引i处的字符p[i],如果它前面存在最长相等前后缀,则`next[i]`等于此公共前后缀的长度;否则为0。 - 特殊情况下,`next[0]=-1`表示第一个字符之前没有任何有效信息可以用来加速搜索过程[^2]。 #### 构建Next数组的方法 构建`next`数组的过程实际上是对模式串自身的某种形式上的动态规划求解最大相同前后缀问题。其核心在于维护两个指针j和k分别指向当前正在考察的目标位置以及上一步找到的最大相同前后缀结尾后的起始位置,并根据两者所指示字符间的关系调整它们之间的相对距离直至遍历完整个模式串为止。 ```python def build_next(pattern): next_array = [-1] * len(pattern) k = -1 for i in range(1, len(pattern)): while k != -1 and pattern[k + 1] != pattern[i]: k = next_array[k] if pattern[k + 1] == pattern[i]: k += 1 next_array[i] = k return next_array ``` ### KMP算法的具体流程 基于准备好的`next`数组,实际执行字符串匹配操作就变得非常直观了:初始化两个游标s和t分别代表源字符串中的当前位置和目标模式串内的对应偏移量;每当发现一处完全吻合的部分即意味着找到了一个新的合法实例;而一旦检测到冲突则依据预先计算得到的结果迅速定位至最有可能成功的候选起点继续试探下去直到完成整个扫描周期或者提前终止条件被触发。 ```python def kmp_search(text, pattern): n_text = len(text) m_pattern = len(pattern) # 获取pattern对应的next数组 next_arr = build_next(pattern) s = t = 0 while s < n_text and t < m_pattern: if text[s] == pattern[t]: s += 1 t += 1 elif next_arr[t] == -1: s += 1 else: t = next_arr[t] if t >= m_pattern: return s - m_pattern else: return -1 ``` ### KMP算法的时间复杂度分析 由于每次失败后都能借助已知信息快速前进若干步而非仅仅挪动一点点,因此理论上讲KMP能够在O(n+m)时间内解决问题其中n是待查序列总长m则是模板本身大小这使得它成为解决此类任务的理想选择之一特别是针对那些具有高度规律性的输入样本而言更是如此。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

数学家是我理想

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值