KMP算法 模板

本文详细介绍了一种高效的字符串匹配算法——KMP算法,并提供了完整的C++实现代码。文章首先定义了KMP算法所需的变量和数据结构,然后逐步解释了next数组的创建过程及KMP匹配过程。此外,还通过一个具体的例题演示了如何使用KMP算法解决实际问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

KMP模板

#include<cstdio>
#include<cstring>
#include<string>
#include<cmath>
#include<iostream>
#include<algorithm>
using namespace std;
const int maxn = 100005;
char t[maxn],p[maxn];
int lent,lenp;
int next[maxn];
int h=0;//数组从0开始就赋值为0,从1开始就赋值为1,等等,t数组和p数组要统一
void createNext()
{
    int j=h-1;
    next[h]=j;
    for(int i=h+1;i<h+lenp;i++){
        while(j>h-1&&p[j+1]!=p[i]){
            j=next[j];
        }

        if(p[j+1]==p[i]){
            ++j;
        }
        next[i]=j;
    }
    /*for(int i=h;i<h+lenp;i++){
        printf("next%d: %d\n",i-h+1,next[i]);
    }*/
}
int KMP()
{
    int num=0;//统计出现次数
    int j=h-1;
    for(int i=h;i<h+lent;i++){
        while(j>h-1&&p[j+1]!=t[i]){
            j=next[j];
        }
        if(p[j+1]==t[i]){
            ++j;
        }
        if(j==lenp+h-1){
            j=next[j];// ***
            num++;
            return i-lenp+1;//模式串在文本串中第一次出现的位置
        }
    }
    if(num==0){    //如果不存在就会返回-1,要想返回出现次数就把这个if和上面的return注释掉
        return -1;
    }
    //return num;//返回模式串在文本串中出现的次数(允许部分重叠,如果要不允许重叠,把注释有***的那一行改为j=h-1)
}
int main(void)
{
    gets(t);
    gets(p);
    lenp=strlen(p);//不是从0开始的记得改成 p+开始的位置
    lent=strlen(t);

    createNext();
    printf("pos: %d\n",KMP());
    return 0;
}


一道例题的应用:CodeForces-gym101466E-Text Editor
AC代码:

#include<cstdio>
#include<cstring>
#include<string>
#include<cmath>
#include<iostream>
#include<algorithm>
using namespace std;
const int maxn = 100005;
char t[maxn],p[maxn];
int lent,lenp;
int next[maxn];
int h=0;//数组从0开始就赋值为0,从1开始就赋值为1,等等,t数组和p数组要统一
void createNext()
{
    int j=h-1;
    next[h]=j;
    for(int i=h+1;i<h+lenp;i++){
        while(j>h-1&&p[j+1]!=p[i]){
            j=next[j];
        }

        if(p[j+1]==p[i]){
            ++j;
        }
        next[i]=j;
    }
    /*for(int i=h;i<h+lenp;i++){
        printf("next%d: %d\n",i-h+1,next[i]);
    }*/
}
int KMP(int len)
{
    int num=0;//统计出现次数
    int j=h-1;
    for(int i=h;i<h+lent;i++){
        while(j>h-1&&p[j+1]!=t[i]){
            j=next[j];
        }
        if(p[j+1]==t[i]){
            ++j;
        }
        if(j==len-1){
            j=next[j];// ***
            num++;
            //return i;//模式串在文本串中第一次出现的位置,如果不存在会返回h+lent
        }
    }
    return num;//返回模式串在文本串中出现的次数(允许部分重叠,如果要不允许重叠,把注释有***的那一行改为j=h-1)
}
int main(void)
{
    gets(t);
    gets(p);
    //scanf("%s%s",t,p);//有空格记得换成gets
    lenp=strlen(p);//不是从0开始的记得改成 p+开始的位置
    lent=strlen(t);
    createNext();

    int k;
    scanf("%d",&k);

    int l=1,r=lenp;
    int ans=-1;
    while(l<=r){
        int mid=(l+r)>>1;
        if(KMP(mid)>=k){
            ans=mid;
            l=mid+1;
        }
        else{
            r=mid-1;
        }
    }
    if(ans==-1){
        printf("IMPOSSIBLE\n");
    }
    else{
        for(int i=0;i<ans;i++){
            printf("%c",p[i]);
        }
        printf("\n");
    }
    return 0;
}
<think>嗯,用户需要KMP算法的C++实现模板。首先,我得回忆一下KMP算法的原理。KMP主要用于字符串匹配,通过构建部分匹配表(也就是前缀函数)来避免不必要的回溯,提高效率。那实现的话,主要分两部分:构建next数组和实际的匹配过程。 接下来,我需要确定如何用C++模板来实现。模板的话,可能需要处理不同的字符类型,比如char或者wchar_t,所以模板参数应该是typename T。然后,类里面应该包含构建next数组的方法和搜索的方法。 记得next数组的构建是关键。对于模式串,需要找到每个位置的最长相同前缀和后缀的长度。这个过程可以通过迭代来完成。比如,初始化next数组第一个元素为0,然后用一个指针j从0开始,i从1开始,逐个比较字符,根据是否匹配来更新j的值,并记录到next数组中。 然后,搜索函数需要遍历主字符串,同样使用两个指针i和j,分别对应主串和模式串的位置。当字符匹配时,两个指针都前进;不匹配时,根据next数组回退j的位置。如果j到达模式串末尾,说明找到了匹配,记录位置,并继续搜索可能的其他匹配。 还要考虑代码的效率和正确性。比如,在构建next数组时,边界条件处理是否正确,比如空字符串或者长度为1的情况。另外,搜索函数中,如何处理多个匹配的情况,是否需要全部返回还是只找第一个。 可能用户还希望代码有注释,解释关键步骤,这样更容易理解。比如,在构建next数组的部分,解释每一步的操作,或者在搜索循环中说明回退的逻辑。 然后,参考用户提供的引用,比如引用[3]中的模板结构,可能需要注意类的继承或者成员函数的定义方式。不过KMP实现可能不需要继承,直接作为一个独立的模板类更合适。 最后,测试示例也是必要的,比如用主函数展示如何使用这个模板类,传入主串和模式串,输出匹配位置。这样用户可以直接看到如何使用代码。 总结下来,步骤应该是: 1. 定义模板KMP,包含私有成员next数组和模式串。 2. 构造函数中初始化模式串并构建next数组。 3. 实现构建next数组的函数。 4. 实现搜索函数,返回所有匹配的起始位置。 5. 提供示例代码,展示用法。 需要确保代码语法正确,比如正确的循环范围,指针是否越界,以及模板参数的正确使用。此外,代码风格要清晰,变量命名有意义,比如用pattern_表示模式串,next_表示部分匹配表,search函数返回vector<int>类型的位置索引。 可能的问题点:在构建next数组时,循环的起始和终止条件是否正确,比如i是否从1开始到n-1结束。还有,当j>0时,回退到next[j-1]是否正确。这部分需要仔细检查,避免逻辑错误。 另外,在搜索函数中,当j等于模式串长度时,记录的位置应该是i - j,然后回退j到next[j-1]继续搜索,这样能处理重叠的匹配情况,比如模式串"ABAB"在主串"ABABAB"中的匹配。 最后,测试示例应该覆盖正常情况、无匹配情况以及多个匹配的情况,确保代码的正确性。</think>### KMP算法C++实现模板 KMP算法通过预处理生成部分匹配表(prefix table)实现高效字符串匹配[^2],以下是支持模板化字符类型的实现: ```cpp #include <vector> #include <string> template<typename CharType> class KMP { private: std::vector<int> next_; std::basic_string<CharType> pattern_; void buildNext() { int n = pattern_.length(); next_.resize(n); next_[0] = 0; for (int i = 1, j = 0; i < n; ++i) { while (j > 0 && pattern_[i] != pattern_[j]) { j = next_[j-1]; } if (pattern_[i] == pattern_[j]) ++j; next_[i] = j; } } public: explicit KMP(const std::basic_string<CharType>& pattern) : pattern_(pattern) { buildNext(); } std::vector<int> search(const std::basic_string<CharType>& text) { std::vector<int> matches; int m = text.length(); int n = pattern_.length(); for (int i = 0, j = 0; i < m; ++i) { while (j > 0 && text[i] != pattern_[j]) { j = next_[j-1]; } if (text[i] == pattern_[j]) ++j; if (j == n) { matches.push_back(i - n + 1); j = next_[j-1]; } } return matches; } }; // 使用示例 int main() { std::string text = "ABABDABACDABABCABAB"; std::string pattern = "ABABCABAB"; KMP<char> kmp(pattern); auto positions = kmp.search(text); // 输出匹配位置:10 for (int pos : positions) { std::cout << pos << " "; } return 0; } ``` ### 代码解析 1. **模板设计**:支持`char`/`wchar_t`等字符类型,通过`std::basic_string`实现泛型 2. **部分匹配表**:`buildNext()`函数生成最长公共前后缀长度表,时间复杂度$O(m)$ 3. **搜索过程**:时间复杂度$O(n)$,利用next数组避免回溯 4. **匹配定位**:返回所有匹配起始位置的vector容器
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值