KMP算法(代码)

KMP是字符串模式匹配算法,主要的核心:

对于目标字符串ptrababaca,长度是7,所以next[0]next[1]next[2]next[3]next[4]next[5]next[6]分别计算的是 

aababaababababaababacababaca的相同的最长前缀和最长后缀的长度。由于aababaababababaababacababaca的相同的最长前缀和最长后缀是“”“”“a”“ab”“aba”“”“a”,所以next数组的值是[-1,-1,0,1,2,-1,0],这里-1表示不存在,0表示存在长度为12表示存在长度为3。这是为了和代码相对应。


next数组就是说一旦在某处不匹配时(下图绿色位置AB),移动ptr字符串,使str的对应的最大后缀(红色2)和ptr对应的最大前缀(红色3)对齐,然后比较A和C。

next数组的值,就是下次往前移动字符串ptr的移动距离。比如next中某个字符对应的值是4,则在该字符后的下一个字符不匹配时,可以直接移动往前移动ptr 5个长度,再次进行比较判别。







#include <iostream>
#include <vector>
#include <string>

using namespace std;

void buildnext(string& s, vector<int>& next, int n)
{
    //next[j]的值(也就是k)表示,当P[j] != T[i]时,j指针的下一步移动位置。
    int k = -1;
    int j = 0;
    while(j < n)
    {
        if(k == -1 || s[j] == s[k])
        {
            next[++j] = ++k;
        }
        else
        {
            k = next[k];
        }
    }
}

int KMP(string t, string p)
{
    int i = 0;  //主串位置
    int j = 0;  //模式串位置
    vector<int> next(p.size() + 1, -1);
    buildnext(p, next, p.size());
    
    for (auto it : next)
        cout<<it<<" ";
    cout<<endl;
    
    int tsize = t.size();  //这个地方size()需要转化,不然后面while循环会突然退出
    int psize = p.size();
    while (i < tsize && j < psize )
    {
        if (j == -1 || t[i] == p[j])  // 当j为-1时,要移动的是i,当然j也要归0
        {
            i++;
            j++;
        }
        else// i不需要回溯了 i = i - j + 1;
        {
            j = next[j];
        }
    }
    if (j == p.size())
        return i - j;
    else
        return -1;
}

int main(void)
{
    string T = "liqinzhe";
    string S = "zh";
    cout<< KMP(T, S);
    return 0;
}





评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值