KMP算法详解

本文深入讲解KMP算法的原理及实现过程,包括前后缀匹配的概念、nxt数组的意义及其求解方法,通过具体实例帮助读者理解算法的工作流程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

直接进入正题

定义 nxt[i]nxt[i]t[0]t[i1]t[0]−−t[i−1] 中前后缀匹配最长长度,即,有最大长度为 nxt[i]nxt[i] 的相同前缀后缀, t[0]t[nxt[i]1]t[0]−−t[nxt[i]−1] 分别和 t[inxt[i]]t[i1]t[i−nxt[i]]−−t[i−1] 一一匹配

算法流程:

  • 假设现在文本串 SS 匹配到 i 位置,模式串 TT 匹配到 j 位置
    • 如果当前字符匹配成功(即 s[i]=t[j]s[i]=t[j]) , i,ji,j 自增,匹配下一个字符
    • 如果当前字符匹配失败(即 s[i]t[j]s[i]≠t[j] ),显然 ii 不变,而 j=nxt[j]
      • 为什么这么跳是合法的?因为已经匹配了 j1j−1
      • 也就是说 s[ij]s[i1]s[i−j]−−s[i−1] 已经和 t[0]t[j1]t[0]−−t[j−1] 一一匹配
      • 而且 t[0]t[nxt[j]1]t[0]−−t[nxt[j]−1] 又与 t[inxt[j]]t[j1]t[i−nxt[j]]−−t[j−1] 一一匹配
      • 所以显然 s[inxt[j]]s[i1]s[i−nxt[j]]−−s[i−1]t[0]t[nxt[j]1]t[0]−−t[nxt[j]−1] 一一匹配
      • 所以原来的 j>nxt[j]j−>nxt[j] 下次直接匹配 iinxt[j]

观察仔细的人可能已经发现,如果一直不匹配到 j=0j=0 时,仍然不匹配,就会陷入死循环。所以我们将 nxt[0]nxt[0] 拿出来设为 1−1

所以当我们求出 nxtnxt 数组之后,它提供的 跳跃 功能能够大大减少时间复杂度

如何求 nxtnxt 数组?

nxtnxt 数组考虑的是除当前字符外的最长相同前后缀,其实就是求出以每个点为结尾的最长相同前后缀向后移动一位,并将第零个位置设为 1−1

根据上面匹配的方法,发现可以用来求 nxtnxt 数组

  • 假设我们已经求出了前 ii 位的 nxt ,当前处理第 ii 个字符,求第 i+1 位的 nxtnxt (想想为什么),且j=nxt[i]j=nxt[i]
    • 如果当前字符匹配成功(即 t[j]=t[i]t[j]=t[i] ),当前匹配长度为 j+1j+1 ,即 nxt[++i]=++jnxt[++i]=++j
    • 如果当前字符匹配失败(即 t[j]t[i]t[j]≠t[i] ),那么 jj 向前跳,即 j=nxt[j]
      • 请通过上面匹配的原理证明这样求得 nxtnxt 方法的正确性

具体代码如下:

//s为模板串,t为匹配串
int ls = strlen(s) , lt = strlen(t);
i = 0 , j = -1;
nxt[0] = -1;
while(i < lt) {
    if(j == -1 || t[i] == t[j]) nxt[++ i] = ++ j;
    else j = nxt[j];
}
i = j = 0;
while(i < ls) {
    if(j == -1 || s[i] == t[j]) {++ i; ++ j;}
    else j = nxt[j];
    if(j == lt) {printf("%d\n" , i - lt + 1) , j = nxt[j];}
}

小优化
观察发现假如在匹配时,当 s[i]t[j]s[i]≠t[j] 时,下一次匹配必然是 s[i]s[i]t[nxt[j]]t[nxt[j]] 。假设 t[j]=t[nxt[j]]t[j]=t[nxt[j]] ,显然匹配会再次失败,所以需要使得 t[j]t[nxt[j]]t[j]≠t[nxt[j]]

代码如下:

nxt[0] = -1;
while(i < lt) {
    if(j == -1 || t[i] == t[j]) {
        ++ i; ++ j;
        if(t[i] != t[j]) nxt[i] = j;
        else nxt[i] = nxt[j];
    }
    else j = nxt[j];
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值