KMP与扩展KMP

本文深入讲解了KMP算法的基本原理及其优化版本,并提供了详细的代码实现。通过实例演示了如何使用KMP算法进行字符串匹配,同时介绍了扩展KMP算法的相关概念。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

太久没用过都忘记了, 重新写了一遍, 加上了注释

KMP

O(n+m) O ( n + m )

#include <bits/stdc++.h>
using namespace std;

const int MAXP = 100, MAXT = 100000;
int nxt[MAXP];//nxt[i]:=p[0~i-1]的最长相同前后缀(p[0~nxt[i]-1] == p[i-nxt[i]~i-1])
char t[MAXT], p[MAXP];//p为模式串, t为目标串

//非优化版本
void init_nxt(char p[])
{
    int pl = strlen(p);
    nxt[0] = -1;//nxt[0]为-1
    int j=0, k=-1;
    while(j<pl)
    {//现在正在比较p[j]位置的后缀, k表示p[j]之前的公共前后缀长度
        if(k==-1 || p[j]==p[k]) nxt[++j] = ++k;
        else k = nxt[k];//失配寻找更短的公共前后缀进行比较
    }
}

////************************************************
////***********************************************
////优化版本(kmp数组不再具有公共前后缀长度的意义, 而仅仅是失配后可以跳到的位置)
//void init_nxt(char p[])
//{
//    int pl = strlen(p);
//    nxt[0] = -1;
//    int j=0, k=-1;
//    while(j<pl)
//    {
//        if(k==-1 || p[j]==p[k])
//        {
//            if(p[++j] == p[++k]) nxt[j] = nxt[k];//比上一个版本只多了这一句,
//            else nxt[j] = k;                    // kmp失配时回到公共前后缀后面
//                                                //如果失配字符和公共前后缀后面那个字符相同
//                                                //继续匹配立即失配, 所以寻找更短的一个公共前后缀
//        }
//        else k = nxt[k];
//    }
//}

//len-nxt[len]为字符串循环节长度(如果能整除字符串长度) && kmp[len] != 0, kmp[len]=0时说明不循环(相当于循环节长度为len循环一次)

int kmp(char t[], char p[])
{
    int tl = strlen(t);
    int pl = strlen(p);
    int i=0, j=0;
    while(i<tl && j<pl)
    {
        if(j==-1 || t[i]==p[j]) ++i, ++j;//第一个字符就失配了(p从第一个字符开始, t前进一个字符) || 匹配成功(两个都前进一个字符)
        else j=nxt[j]; //失配后p从j前面一个字符的公共前后缀(p[0~nxt[j]-1]==p[j-nxt[j]~j-1]), 下一个位置(p[nxt[j]])开始继续比较
    }
    return j==pl ? i-j : -1;//没有匹配-1, 匹配到返回匹配开始的位置
}


int main()
{
    char t[] = "abcaabbccabcdeab";
    char p[] = "abbabbabbabbabb";
    init_nxt(p);
    for(int i=0; p[i-1]!='\0'; ++i) cout << nxt[i] << " ";
    cout << endl;
    cout << kmp(t, p);

    return 0;
}

KMP 算法(1):如何理解 KMP

扩展KMP

O(n+m) O ( n + m )
感觉不太常用

#include <bits/stdc++.h>
using namespace std;

const int MAXN = 1E6;
int nxt[MAXN], ex[MAXN];
//ex[i]:=S[i~s_len-1]与T最长公共前缀长度
//nxt[i]:=T[i~t_len-1]与T最长公共前缀长度

void init_nxt(char s[])
{
    int len = strlen(s);
    nxt[0] = len;
    int a, p;//匹配成功字符最远位置p, 及这次匹配起始位置a
    for(int i=0, j=-1; i<len; ++i, --j)//j为p与i的距离
    {
        if(j<0 || i+nxt[i-a]>=p)
        {
            if(j<0) p=i, j=0;//如果j<0(i大于p), 从头开始比较
            while(p<len && s[p]==s[j]) ++p, ++j;
            nxt[i] = j;
            a = i;
        }
        else nxt[i] = nxt[i-a];
    }
}

void init_ex(char s1[], char s2[])
{
    init_nxt(s2);
    int a, p;
    int l1 = strlen(s1), l2 = strlen(s2);

    for(int i=0, j=-1; i<l1; ++i, --j)
    {
        if(j<0 || i+nxt[i-a]>=p)
        {
            if(j<0) p=i, j=0;
            while(p<l1 && j<l2 && s1[p]==s2[j]) ++p, ++j;
            ex[i] = j;
            a = i;
        }
        else ex[i] = nxt[i-a];
    }
}

int main()
{
    char s1[] = "abcdabcdcbcbcd";
    char s2[] = "bcd";
    init_ex(s1, s2);
    cout << s1 << endl;
    for(int i=0; i<strlen(s1); ++i) cout << ex[i];
    cout << endl;

    return 0;
}

扩展 KMP 算法
拓展kmp算法总结

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值