数据结构 笔记:KMP子串查找算法

KMP算法通过部分匹配表优化了子串查找的效率,避免了不必要的字符回溯。部分匹配值是前缀和后缀最长共有元素的长度,可以递推生成。在匹配失败时,移动位数等于已匹配字符数减去对应的部分匹配值。这种算法提高了字符串匹配的性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

发现

-匹配失败时的右移位数与子串本身相关,与目标串无关

-移动位数=已匹配的字符数-对应的部分匹配值

-任意子串都穿在一个唯一的部位匹配表

前缀

-除了最后一个字符以外,一个字符串的全部头部组合

后缀

-出了第一个字符以外,一个字符串的全部尾部组合

部分匹配值

-前缀和后缀最长共有元素的长度

 字符前缀后缀交集匹配
1A0
2ABAB0
3ABCA,ABBC,C0
4ABCDA,AB,ABCBCD,CD,D0
5ABCDAA,AB,ABC,ABCDBCDA,CDA,DA,AA1
6ABCDABA,AB,ABC,ABCD,ABCDABCDAB,CDAB,DAB,AB,BAB2
7ABCDABD

A,AB,ABC,ABCD,ABCDA,

ABCDAB

BCDABD,CDABD,DABD,ABD,BD,D0

实现关键

-PMT[1] = 0(下标为0的元素匹配值为0)

-从2个字符开始递推(从下标为1的字符开始递推)

-假设PMT[n] = PMT[n-1] +1(最长共有元素的长度)

-当假设不成立,PMT[n] 在PMT[n-1]的基础上减小

部分匹配表的使用(KMP算法)

#include <iostream>

int* make_pmt(const char* p)
{
    int len = strlen(p);
    int* ret = static_cast<int*>(malloc(sizeof(int) * len));

    if( ret != NULL)
    {
        int ll = 0;

        ret[0] = 0;

        for(int i = 1;i<len;i++)
        {
            while((ll > 0) && p[ll] != p[i])
            {
                ll = ret[ll -1];
            }
            if(p[ll] == p[i])
            {
                ll++;
            }

            ret[i] = ll;
        }
    }
    return ret;
}

int kmp(const char* s,const char* p)
{
    int ret = -1;
    int sl = strlen(s);
    int pl = strlen(p);
    int* pmt = make_pmt(p);

    if((pmt != NULL)&&(0 < pl) &&(pl <= sl))
    {
        for(int i = 0,j = 0;i<sl;i++)
        {
            while((j > 0) && (s[i] != p[j]))
            {
                j = pmt[j-1];

            }

            if(s[i] == p[j])
            {
                j++;
            }

            if( j == pl )
            {
                ret = i  + 1 - pl;
                break;
            }
        }
    }
    free(pmt);

    return ret;
}

int main()
{
    cout << kmp("sfshdfuweihrfwshfuiwehfuwefiwhe","sfshdfuweihrfwshfuiwehfuwefiwhes") << endl;


    return 0;
}

总结:

-部分匹配表示提高子串查找效率的关键

-部分匹配值定义为前缀和后缀最长共有元素的长度

-可以用递推的方法产生部分匹配表

-KMP利用部分匹配值与子串移动位数的关系提高查找效率

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值