KMP算法模板

http://www.matrix67.com/blog/archives/115

求next函数模板:

void GetNext(char *s)
{
    int len = strlen(s);
    int i,j;
    i = 0; j = -1;//j从0开始,i从1开始
    next[0] = -1;
    for (i = 1; i < len; ++i)
    {
        while (j > -1 && s[j + 1] != s[i])//不相同的话j就跳跃知道相同或者成为-1
        j = next[j];
        if (s[j + 1] == s[i]) ++j;//相同更新j
        next[i] = j;//每一次都要求出next[i]
    }
}

  

kmp模板:

void kmp(char *s1,char *s2)//s1副串 s2主串
{
    int len1 = strlen(s1);
    int len2 = strlen(s2);
    int i,j = -1;
    int ans = 0;
    for (i = 0; i < len2; ++i)
    {
        while (j > -1 && s1[j + 1] != s2[i]) j = next[j];
        if (s1[j + 1] == s2[i]) ++j;
        if (j == len1 - 1)//找到子串,后继续查找
        {
            ans++;
            j = next[j];
        }
    }
    printf("%d\n",ans);
}

  

<think>嗯,用户需要KMP算法的C++实现模板。首先,我得回忆一下KMP算法的原理。KMP主要用于字符串匹配,通过构建部分匹配表(也就是前缀函数)来避免不必要的回溯,提高效率。那实现的话,主要分两部分:构建next数组和实际的匹配过程。 接下来,我需要确定如何用C++模板来实现。模板的话,可能需要处理不同的字符类型,比如char或者wchar_t,所以模板参数应该是typename T。然后,类里面应该包含构建next数组的方法和搜索的方法。 记得next数组的构建是关键。对于模式串,需要找到每个位置的最长相同前缀和后缀的长度。这个过程可以通过迭代来完成。比如,初始化next数组第一个元素为0,然后用一个指针j从0开始,i从1开始,逐个比较字符,根据是否匹配来更新j的值,并记录到next数组中。 然后,搜索函数需要遍历主字符串,同样使用两个指针i和j,分别对应主串和模式串的位置。当字符匹配时,两个指针都前进;不匹配时,根据next数组回退j的位置。如果j到达模式串末尾,说明找到了匹配,记录位置,并继续搜索可能的其他匹配。 还要考虑代码的效率和正确性。比如,在构建next数组时,边界条件处理是否正确,比如空字符串或者长度为1的情况。另外,搜索函数中,如何处理多个匹配的情况,是否需要全部返回还是只找第一个。 可能用户还希望代码有注释,解释关键步骤,这样更容易理解。比如,在构建next数组的部分,解释每一步的操作,或者在搜索循环中说明回退的逻辑。 然后,参考用户提供的引用,比如引用[3]中的模板类结构,可能需要注意类的继承或者成员函数的定义方式。不过KMP实现可能不需要继承,直接作为一个独立的模板类更合适。 最后,测试示例也是必要的,比如用主函数展示如何使用这个模板类,传入主串和模式串,输出匹配位置。这样用户可以直接看到如何使用代码。 总结下来,步骤应该是: 1. 定义模板KMP,包含私有成员next数组和模式串。 2. 构造函数中初始化模式串并构建next数组。 3. 实现构建next数组的函数。 4. 实现搜索函数,返回所有匹配的起始位置。 5. 提供示例代码,展示用法。 需要确保代码语法正确,比如正确的循环范围,指针是否越界,以及模板参数的正确使用。此外,代码风格要清晰,变量命名有意义,比如用pattern_表示模式串,next_表示部分匹配表,search函数返回vector<int>类型的位置索引。 可能的问题点:在构建next数组时,循环的起始和终止条件是否正确,比如i是否从1开始到n-1结束。还有,当j>0时,回退到next[j-1]是否正确。这部分需要仔细检查,避免逻辑错误。 另外,在搜索函数中,当j等于模式串长度时,记录的位置应该是i - j,然后回退j到next[j-1]继续搜索,这样能处理重叠的匹配情况,比如模式串"ABAB"在主串"ABABAB"中的匹配。 最后,测试示例应该覆盖正常情况、无匹配情况以及多个匹配的情况,确保代码的正确性。</think>### KMP算法C++实现模板 KMP算法通过预处理生成部分匹配表(prefix table)实现高效字符串匹配[^2],以下是支持模板化字符类型的实现: ```cpp #include <vector> #include <string> template<typename CharType> class KMP { private: std::vector<int> next_; std::basic_string<CharType> pattern_; void buildNext() { int n = pattern_.length(); next_.resize(n); next_[0] = 0; for (int i = 1, j = 0; i < n; ++i) { while (j > 0 && pattern_[i] != pattern_[j]) { j = next_[j-1]; } if (pattern_[i] == pattern_[j]) ++j; next_[i] = j; } } public: explicit KMP(const std::basic_string<CharType>& pattern) : pattern_(pattern) { buildNext(); } std::vector<int> search(const std::basic_string<CharType>& text) { std::vector<int> matches; int m = text.length(); int n = pattern_.length(); for (int i = 0, j = 0; i < m; ++i) { while (j > 0 && text[i] != pattern_[j]) { j = next_[j-1]; } if (text[i] == pattern_[j]) ++j; if (j == n) { matches.push_back(i - n + 1); j = next_[j-1]; } } return matches; } }; // 使用示例 int main() { std::string text = "ABABDABACDABABCABAB"; std::string pattern = "ABABCABAB"; KMP<char> kmp(pattern); auto positions = kmp.search(text); // 输出匹配位置:10 for (int pos : positions) { std::cout << pos << " "; } return 0; } ``` ### 代码解析 1. **模板设计**:支持`char`/`wchar_t`等字符类型,通过`std::basic_string`实现泛型 2. **部分匹配表**:`buildNext()`函数生成最长公共前后缀长度表,时间复杂度$O(m)$ 3. **搜索过程**:时间复杂度$O(n)$,利用next数组避免回溯 4. **匹配定位**:返回所有匹配起始位置的vector容器
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值