kmp 详解 -csdn博客

本文深入解析了KMP算法,一种高效的字符串匹配算法,通过预处理next数组,避免了传统方法在不匹配时的重复比较,实现了O(m+n)的时间复杂度。文章详细介绍了next数组的构造过程和KMP算法的具体实现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

kmp算法是用来对字符串进行匹配的一种算法。对于长度为n的字符串N,要查找其中长度为m的一个字符串M,传统的暴力方法的复杂度为O( n*m ),而用kmp算法时间复杂度为O( m+n )。因此,kmp算法是一种很实用的算法,在acm竞赛中是一种必会算法之一

KMP算法详解

kmp算法的实现是借助了一个next数组,该数组是通过对要查找的字符串M进行预处理,然后实现在查找是如果在i位出现不匹配的话,并非从头到尾全部重新匹配(暴力的方法),而是用next数组找到能够最大满足前缀匹配的下标。
具体如图所示:(图片参考)

  • 构造next数组
    这里写图片描述
  • 进行匹配,出现不成功

这里写图片描述

  • 借助next数组进行保留最长前缀的匹配 v
    这里写图片描述

代码实现

#include<bits/stdc++.h>
bool SUBMIT = false;
using namespace std;
const int inf = 1000;
int nex[inf];
string s,h;
void Getnex(string m)//对kmp数组的构造
{
    nex[0]=-1;
    int k=-1,j=0;
    while(j<m.size())
    {
        if(k==-1||m[k]==m[j])
        {
            k++;j++;
            nex[j]=k;
        }else
        k=nex[k];
    }
}
int kmp()//用kmp进行匹配
{
    int k=0,j=0;
    while(j<h.size())
    {
        if(k==-1||s[k]==h[j])
        {
            k++;j++;
        }else{
        k=nex[k];
        cout<<k<<"  "<<j<<endl;
        }
        if(k == s.size())
            return j-k;
    }
    return -1;
}
int main()
{
    if(SUBMIT)freopen("i.txt","r",stdin);else _;
    cin>>h>>s;
    cout<<h<<endl<<s<<endl;
    Getnex(s);
        for(int i=0;i<s.size();i++)
        cout<<nex[i];
    cout<<endl;
    int ans=kmp();
    cout<<ans<<endl;

    return 0;
}
  • 其实我对kmp构造的快速理解就是kmp首先对字符串处理的保证c = next [ i ]本身指定的位置为 c 的前 c - 1 位是匹配的。因此,在构造的时候用了如果第k 为 和第 j 为相等,那么保证nex [ j + 1 ] = k+1;
我们这里说的KMP不是拿来放电影的(虽然我很喜欢这个软件),而是一种算法KMP算法是拿来处理字符串匹配的。换句话说,给你两个字符串,你需要回答,B串是否是A串的子串(A串是否包含B串)。比如,字符串A="I'm matrix67",字符串B="matrix",我们就说B是A的子串。你可以委婉地问你的MM:“假如你要向你喜欢的人表白的话,我的名字是你的告白语中的子串吗?” 解决这类问题,通常我们的方法是枚举从A串的什么位置起开始与B匹配,然后验证是否匹配。假如A串长度为n,B串长度为m,那么这种方法的复杂度是O (mn)的。虽然很多时候复杂度达不到mn(验证时只看头一两个字母就发现不匹配了),但我们有许多“最坏情况”,比如,A= "aaaaaaaaaaaaaaaaaaaaaaaaaab",B="aaaaaaaab"。我们将介绍的是一种最坏情况下O(n)的算法(这里假设 m<=n),即传说中的KMP算法。 之所以叫做KMP,是因为这个算法是由Knuth、Morris、Pratt三个提出来的,取了这三个人的名字的头一个字母。这时,或许你突然明白了AVL 树为什么叫AVL,或者Bellman-Ford为什么中间是一杠不是一个点。有时一个东西有七八个人研究过,那怎么命名呢?通常这个东西干脆就不用人名字命名了,免得发生争议,比如“3x+1问题”。扯远了。 个人认为KMP是最没有必要讲的东西,因为这个东西网上能找到很多资料。但网上的讲法基本上都涉及到“移动(shift)”、“Next函数”等概念,这非常容易产生误解(至少一年半前我看这些资料学习KMP时就没搞清楚)。在这里,我换一种方法来解释KMP算法
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值