KMP算法及其实现（C++）

最新推荐文章于 2025-12-21 21:47:42 发布

原创最新推荐文章于 2025-12-21 21:47:42 发布 · 115 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#c++ #开发语言

代码随想录力扣刷题专栏专栏收录该内容

8 篇文章

订阅专栏

哈喽！今天我要给大家介绍一种字符串匹配算法，KMP算法。KMP算法是由位科学家共同发明的，他们的名字分别是Knuth、Morris和Pratt。现在让我把它的思路和原理以通俗易懂的方式向大家解释一下吧！

首先，我们来说说问题背景。想象一下，当我们在一大篇文章中查找某个特定的单词时，我们会怎么做呢？一种最直接的方法就是从文章的头开始，一个一个地比对每个字符，看看有没有和我们要找的单词的第一个字符相同的。如果找到了，那就继续比对后续的字符；如果不相同，那我们就将指针向后移动一位，重新开始比对下一个字符。

这种暴力比对的方法虽然可行，但是效率并不高，算法复杂度为O（n）。而KMP算法的目标就是在不必要的比对中节约时间，提高查找效率。它通过构建一个特殊的表格，来帮助我们在匹配过程中跳过一些不必要的字符比对。

具体来说，KMP算法的核心思想是，当出现字符不匹配的时候，我们不会简单地回到原点重新比对，而是通过已有的信息，直接跳过一些比对，继续往后查找。这个信息其实就是一个叫做"Next"数组的东西，里面存储了一些神奇的数值。

Next数组的构建过程是这样的：首先我们要找出待查找的模式字符串中的相同前缀和后缀，然后根据这些前缀和后缀的长度关系进行计算得到Next数组的值。例如，如果我们要查找的模式字符串是"ABCDABD"，[0,0,0,0,1,2,0]。这个取决于自己的next数组是怎么构建的了。

有了Next数组之后，我们进行匹配的时候就可以事先知道应该跳过多少个字符，而不用一个一个地比对每个字符。这样一来，我们的匹配过程就更加高效了！

下面讲解一下Next数组的含义，内容来自代码随想录字符串章节。

Next数组就是一个前缀表（prefix table）。

前缀表有什么作用呢？

前缀表是用来回退的，它记录了模式串与主串(文本串)不匹配的时候，模式串应该从哪里开始重新匹配。

class Solution {
public:
    void getNext(int* next, const string& s)
    {
        int j = 0;
        next[0]  = j;
        for(int i = 1; i < s.size(); i++)
        {
            while(j > 0 && s[i] != s[j])
            {
                j = next[j - 1];
            }
            if(s[i] == s[j])
            {
                j++;
            }
            next[i] = j;
        }
    }
    int strStr(string haystack, string needle) {
        if (needle.size() == 0)
        {
            return -1;
        }
        int next[needle.size()];
        getNext(next,needle);
        int j = 0;
        for (int i = 0; i < haystack.size(); i++)
        {
            while(j > 0 && haystack[i] != needle[j])
            {
                j = next[j - 1];
            }
            if (haystack[i] == needle[j])
            {
                j++;
            }
            if(j == needle.size())
            {
                return (i-needle.size() + 1);
            }
        }
        return -1;
    }

};

总结一下，KMP算法就是通过构建Next数组来实现高效的字符串匹配。它的思路是，在字符不匹配时，根据已有信息跳过一定数量的字符，从而提高匹配效率。这种算法非常巧妙，不仅能在字符串匹配中大显身手，还可以应用于其他各种领域。

希望我给大家的解释能够让你们对KMP算法有一个初步的了解。如果你对KMP算法还有其他疑问或者想要深入了解，可以继续关注我的博客哦。