改进的模式匹配算法—KMP算法

最新推荐文章于 2025-09-09 15:52:39 发布

原创

最新推荐文章于 2025-09-09 15:52:39 发布 · 240 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#算法

KMP算法通过构建next数组避免回溯，利用已匹配信息提高字符串匹配效率。它在暴力匹配中的低效问题中发挥作用，适用于大规模文本搜索和DNA序列匹配，显著减少计算时间。

在暴力匹配中，每趟匹配失败都是模式后移一位再从头开始比较。而某趟已匹配相等的字符序列是模式的某个前缀，这种频繁的重复比较相当于模式串在不断地进行自我比较，这就是低效率的根源。

理解KMP算法

KMP算法，全称为Knuth-Morris-Pratt算法，是一种字符串匹配算法，用于在一个文本串S中查找一个模式串P的出现位置。相较于传统的暴力匹配算法，KMP算法具有更高的效率。

KMP算法的核心思想是利用已经匹配过的信息，避免不必要的回溯。它通过构建一个辅助数组next[]，记录模式串中每个位置之前最长的相同前缀和后缀的长度。在进行匹配时，当出现不匹配的情况时，通过查找next数组得到一个新的起始位置，从而避免重复匹配已经比较过的部分。

具体KMP算法流程

预处理模式串P，构建next数组。
设置两个指针i和j，分别指向文本串S和模式串P的起始位置。
逐个比较S[i]与P[j]的字符：

若匹配成功，则i和j同时后移。
若匹配失败，根据next数组找到一个新的j值，使得P[0...j-1]与S[i-j+1...i-1]相等。

重复步骤3直至达到文本串或模式串的末尾。
若找到匹配，返回匹配的起始位置；否则，返回-1。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

一条晒干的咸魚

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

数据结构 —— 改进的KMP算法

starter_____的博客

05-16

6311

KMP算法如果我们要对下面的主串P和模式串P进行匹配步骤一：i=3，j=3 模式串 “abab” 对应的 next 数组为-1 0 0 1（0 0 1 2整体右移一位，初值赋为-1），当模式串 P 和主串 S 进行匹配时，发现b跟c失配，于是模式串 P 右移 j - next[ j ] = 3 - 1 =2位。步骤二：i=3，j=1 右移2位后，b又跟c失配。事实上，因为在上一步的匹配中，...

KMP算法及其改进图文详解

Forward♞的博客

05-21

6018

KMP算法是一种改进的字符串匹配算法，由D.E.Knuth，J.H.Morris和V.R.Pratt提出的，因此人们称它为克努特—莫里斯—普拉特操作（简称KMP算法）。KMP算法的核心是利用匹配失败后的信息，尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个next()函数实现，函数本身包含了模式串的局部匹配信息。KMP算法的时间复杂度]O(m+n)。

参与评论您还未登录，请先登录后发表或查看评论

一种改进的KMP算法

12-15

在给出改进的KMP模式匹配算法的定义和步骤的同时，对其进行了严格推导和证明．实验证明。当模式首次出现在文本后半段的情况下，该算法较原KMP算法具有更少的比较次数和更高的效率．

字符串匹配算法之KMP算法（C语言实现）

晨的博客

08-16

1306

#1、KMP算法： KMP算法是一种改进的字符串匹配算法，由D.E.Knuth，J.H.Morris和V.R.Pratt提出的，因此人们称它为克努特—莫里斯—普拉特操作（简称KMP算法）。KMP算法的核心是利用匹配失败后的信息，尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个next()函数实现，函数本身包含了模式串的局部匹配信息。KMP算法的时间复杂度O(m+n) ##2、代码 #include<string.h> #include<malloc.h>

改进的KMP算法

weixin_30877493的博客

07-27

618

//C.h 几乎各程序都需要用到的文件包含宏命令和使用名空间 #ifndef _C_H_ #define _C_H_ #include <iostream> #include <fstream> #include <iomanip> #include <cmath> #include <string> #incl...

串的模式匹配(朴素算法和KMP算法以及KMP的改进算法)

最新发布

2301_76768601的博客

09-09

826

3.其他的next在不匹配的位置前，划一条分界线，模式串一步一步往后退，知道分界线之前 “能对上”，或模式串完全跨过分界线为止。如果当前失败的元素与下一个要比较的元素的一样的话，我们可以直接令当前失败的元素直接指向下一次要比较的元素下标。if (S[x] == S[next[x]])//如果当前的数与下一个数相等的话。//如果不相等直接赋值。如果当前匹配失败的这个元素，与next[j]指向的下一个元素一样的话。

基于BF和KMP的串模式匹配算法设计与实现(C语言).rar-综合文档

05-10

本文档"基于BF和KMP的串模式匹配算法设计与实现(C语言)"将深入探讨两种经典的串模式匹配算法：BF（Brute Force）暴力匹配算法和KMP（Knuth-Morris-Pratt）算法，并展示如何用C语言实现它们。 BF算法，又称朴素匹配...

KMP模式匹配算法C源码.zip

10-24

8. `朴素的模式匹配算法`：这可能是一个基础的、非优化的模式匹配算法，通常指的就是简单的暴力逐个字符比较的方法，用作对比或者作为KMP算法的基础。 KMP算法的主要步骤如下： 1. 预处理模式串，生成next数组。 2....

KMP算法的改进

遇见你是我最美丽的意外

07-02

7393

KMP算法的改进 KMP算法已经在极大程度上提高了子符串的匹配效率，但是仍然有改进的余地。 1. 引入的情景下面我们就其中的一种情况进行分析：主串T为"aaaabcde…" 子串S为"aaaade" 那么容易求得子串的next[]={0,1,2,3,4} 下标 1 2 3 4 5 子串 a a a a d next 0 1 2 3 4 当使用KMP算法进行匹配时，由于T[5]!=S[5], 因此子串指针回溯，子串回溯后变为T[5]与S[4]的关系，依然不等, 子串继续回

KMP算法(改进版)

蚂蚁的技术总结

10-14

3050

/*改进版KMP算法——改进求next数组的算法*/ //改进的求next数组算法 void GetNextval(SqString t,int nextval[]) { int j=0,k=-1; nextval[0]=-1; while(k<t.len) { if(k==-1 || t.ch[j]==t.ch[k]) { k++;j++; //改进的地方 if

KMP模式匹配算法改进

TinnCHEN的博客

06-24

990

KMP模式匹配算法： https://blog.youkuaiyun.com/TinnCHEN/article/details/93459873 KMP模式匹配算法改进：对于next 数组进行了改进。当子串在重复部分匹配失败时，我们发现之前的KMP算法会一位一位往前比较，其实2，3，4，5步骤的判断是多余的。因此我们可以直接跳过重复部分，让首字符直接跟发现不匹配字符部分的后一位进行比较。总结即，子串重复...

kmp算法改进

牧码人的专栏

05-25

1204

KMP算法实现的是数组字符串中的匹配问题：但是经典的数组匹配中，kmp算法只能实现256个字符的匹配，也就是说。最大的匹配字符串的长度是256。但是有很多时候我们需要找到的是在一个很长的字符串中找到我们需要的字符串，这就需要我们对这个算法进行改进。首先我们要看懂算法，算法中之所以有这样的限制是因为就字符串的串的长度这个变量保存到了字符数组的第一个字符中，这样长度就受到了限制。所以改进的

KMP算法————对上一文章的改进

Kaka_chake的博客

08-04

333

#include <stdio.h> #include <stdlib.h> void prefix_table(int prefix[], int pattern[], int n) { prefix[0] = -1; int len = -1, i = 0; while(i<n) { if(pattern[i] =...

KMP算法（三）：算法改进

not_say的博客

04-08

925

KMP算法（一）见链接：https://blog.youkuaiyun.com/not_say/article/details/105291946 一、KMP算法存在的缺陷及改良：这里直接将《大话数据结构》里面的说明截图来用了，因为有画图，说明的比较清楚： public static int[] getNextVal(String son) { int i = 0, j =...

kmp算法及改进

Hyo_yew的博客

04-21

1152

一、failture版 int pmatch(char *string,char *pat) { int i=0,j=0; int lens=strlen(string);//主字符串 int lenp=strlen(pat);//需要匹配的字符串 while(i < lens && j < lenp) { if(...

KMP算法以及改进（C/C++）

深巷

01-08

2674

KMP算法的作用是在一个已知字符串中查找子串的位置,也叫做串的模式匹配。第一种我们容易想到的就是暴力求解法。也叫朴素的模式匹配：简单来说就是：从主串s 和子串t 的第一个字符开始，将两字符串的字符一一比对，如果出现某个字符不匹配，主串回溯到第二个字符，子串回溯到第一个字符再进行一一比对。如果出现某个字符不匹配，主串回溯到第三个字符，子串回溯到第一个字符再进行一一比对，一直到子串字符全部匹配成功。这种算法在最好情况下时间复杂度为O(n)。即子串的n个字符正好等于主串的前n个字符，而最坏的情况下时间复杂度

KMP算法及其改进算法

大灰狼吃树皮

10-18

1454

KMP算法

KMP算法的实现

weixin_47511190的博客

08-17

267

这个算法想了一天才理解，加上写代码改bug花费了很长时间呜呜呜 KMP算法要比串的模式匹配算法时间复杂度要低，效率更高，时间复杂度为：O(n+m)，n为主串长度，m为模式串长度。实现代码： #include<iostream> using namespace std; //求next数组，next数组记录最长公共前后缀的长度 void GetNext(string s, int* next) { int i = -1, j = 0; //i表示前缀最后一个字符 j表示后缀最后一个字符