KMP字符串匹配(3)

最新推荐文章于 2025-01-15 11:37:05 发布

原创最新推荐文章于 2025-01-15 11:37:05 发布 · 847 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#算法

本文深入探讨了KMP算法中next[i]函数的优化，通过实例展示如何减少字符串匹配过程中的无效字符比较，特别针对特定字符序列，如全相同字符或重复模式，提出了一种改进策略，显著提高了算法效率。

现在KMP算法我们基本完成了，对于next[i]函数还有提升的空间，比如字符串"abababaac"中

next[2]=0，字符s[2]="a"失配后应该和s[0]比较，但是s[0]也是"a"，所以必定失配，那么这种

情况可以直接跳过进行下一次匹配，比较极端的情况，字符串"aaaaaab"，当字符s[5]="a"失配

的时候，按next[i]算法，s[5]还要和s[4]，s[3]，s[2]，s[1]，s[0]进行比较，但是这些字符全是a,

因此肯定都失配，可以直接进行next[0]的匹配，减少不必要的比较次数，因此当s[i]==s[next[i]]时，

可以更新next[i]=next[next[i]]，我们只需稍微更改下(2)中计算next[i]的代码：

nnext[0] = -1;

nnext[1] = 0;

if (t[0] == t[1])

nnext[1] = -1;

i=1, j=0;

while (i<tlen){

if (j == -1 || t[i] == t[j]){

++i;

++j;

if (t[i] != t[j] )

nnext[i] = j;

else

nnext[i] =nnext[j];

}

else

j = nnext[j];

}

改进的字符串t="aaaaaab"的nnext值如下表:

	a	a	a	a	a	a	b
i	0	1	2	3	4	5	6
next[i]	-1	0	1	2	3	4	5
nnext[i]	-1	-1	-1	-1	-1	-1	5

改进的字符串t="abababaac"的nnext值如下表:

	a	b	a	b	a	b	a	a	c
i	0	1	2	3	4	5	6	7	8
next[i]	-1	0	0	1	2	3	4	5	1
nnext[i]	-1	0	-1	0	-1	0	-1	5	1

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

expp

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

2023华为OD机试真题【简单的压缩算法/栈】

wtswts1232的博客

04-14

957

{A3B1{C}3}3代表A字符重复3次，B字符重复1次，花括号中的C字符重复3次，最外层花括号中的AAABCCC重复3次。3.遇到字母字符：判断下一个字符是否是数字，若是数字，则将当前字母重复拼接后入栈；2、花括号中的字符串加数字N，表示花括号中的字符重复N次。3、字符加N和花括号后面加N，支持任意的嵌套，包括互相嵌套，例如：压缩内容可以{A3B1{C}3}3。2.遇到字符 ‘}’：计算重复次数，将栈中的字符组合成一个字符串，重复拼接后再入栈。最后，将栈中的字符串顺序拼接，得到解压缩后的字符串。

KMP 字符串匹配算法 (Python）

njnu19210217的博客

04-18

2258

所以如此往复，要么直到 $s[i]=s[j’] $ ，然后转移到第一种情况；中存在的、相等的最长真前缀和真后缀的长度。，其中 $\pi(i)=m $ 的地方，一定完成对模式串。数组为 [0, 1, 0, 1, 2, 2, 3] 实际上，第二长真后缀也完整存在于当前真前缀。两种情况，通过判断 $s[i] $ 是否。的字符串，其前缀函数是一个长度为。例如：‘aabaaab’ 的。的最后位置，所以原始位置为。，因为其不存在真前后缀。位于 $t $ 中。

参与评论您还未登录，请先登录后发表或查看评论

LA3363 String Compression 区间DP

Yu1的博客

09-25

191

题目链接题目大意：给一个字符串，可以进行压缩操作，例如ababab可以压缩成3(ab)，cababcabab可以压缩成2(c2(ab))，以此类推。求字符串压缩后最短长度。字符串长度小于等于200。我们只需用 dp[i][j]dp[i][j]dp[i][j] 表示 i 到 j 的最短长度，而对于一个可以压缩的长串，我们可以枚举一个最靠左的字串，判断是否可以压缩，而压缩后的长度显然可以通过...

codeforces 825F (简单dp + KMP)

Everything can be done!

10-01

867

题意：给出一个字符串，你要把它尽量压缩成一个短的字符串，比如一个字符串ababab你可以转化成3ab，长度为 3，比如bbbacacb转化成3b2ac1b，长度为 7，aaaaaaaaaa转化为10a，长度为 3。思路：先n^2预处理出i,j之间的需要多少长度变成，然后简单状态转移一下。预处理的时候要运用到next数组的性质，即求一个字符串的最小循环的长度，如果len % (len

字节飞书-测开-面试题-最短的可拼接成原字符串的子串（python）

的博客

04-08

1172

给出一个字符串，输出这个字符串的一个最短子串，该子串通过重复拼接能形成整个字符串；例：字符串ababab，求得符合题目要求的子串ab；若无这种子串，则输出整个字符串

[数据结构与算法-21]KMP算法

学哥斌的博客

04-21

1025

文章目录1、应用场景2、暴力匹配算法2.1 案例展示2.2 时间复杂度分析2.3 代码实现2.4 KMP算法对暴力匹配的改进3、 KMP算法3.1 算法原理 1、应用场景 Knuth-Morris-Pratt 字符串查找算法，简称为 KMP算法，常用于在一个文本串 S 内查找一个模式串 P 的出现位置。是用来代替暴力匹配算法的有效算法。如果找到，即返回第一个字符的索引。 2、暴力匹配算...

KMP.rar_KMP_kmp 字符串匹配_kmp失效函数_字符串匹配

09-21

KMP算法，全称为Knuth-Morris-Pratt算法，是一种高效的字符串匹配算法，由Donald Knuth、James H. Morris和 Vaughan Pratt三位学者在1970年代提出。该算法的核心在于利用已知的前缀和后缀信息，避免了在匹配过程中...

字符串匹配的KMP算法.rar_KMP_KMP算法_kmp 字符串匹配_字符串匹配_文件

09-24

总的来说，KMP算法是一种高效的字符串匹配方法，它通过避免不必要的字符比较和回溯，大大提高了搜索效率。理解并掌握KMP算法，对于从事编程和相关领域的专业人士来说，是提高工作效率和解决问题的关键技能之一。

python3 kmp 字符串匹配的方法

09-20

总结一下，Python3 KMP字符串匹配方法是通过预处理模式串的next数组，有效地减少了不必要的字符比较，提高了匹配效率。其核心在于计算next数组并据此调整模式串在匹配失败时的移动方式。这个方法不仅适用于Python，...

Java-KMP字符串匹配算法

最新发布

如果不能对抗遗忘那么就记录

01-15

1315

KMP算法详解

LZW压缩算法原理解析

weixin_33895475的博客

09-30

3001

最近整理Github上以前胡乱写的代码，发现自己还写过压缩算法，大概是不知道什么时候用来练手的。里面我实现了哈夫曼树，LZW字典和算数编码三种压缩算法，时隔几年几乎没什么印象了，尤其是后两种连原理都基本忘了，所以把它们拎出来整理一下，也算是逼自己做个回忆。本篇先讲LZW算法，Wiki里给出的介绍和样例其实还不错，不过我在网上并没有找到很...

UVA 1351-String Compression（KMP算法+DP）

dilemma的专栏

03-10

780

题目大意：给出一串长度不超过200的字符串，相同的部分可以压缩，如ababab可压缩为3(ab)，求压缩的最小长度。容易证明如果一个字符串是周期串，那么要么不压缩，要么以最短的循环串压缩。这里我是用KMP算法预处理出所有子串是否是周期串，若是，计算出最短循环串是多少。递推部分和矩阵链乘相似。用d[i][j]表示从第i个字符到第j个字符的串的最短表示要多少个字符，若str[i...j

字符串s1为“abababab”,字符串s2为“ba”,字符串s3为“ab”,在s1中找到s2的位置并替换为s3

J_aSON_的博客

11-07

1098

这应该是今年3G纳新的面试题。题目是：字符串s1为“abababab”,字符串s2为“ba”,字符串s3为“ab”,在s1中找到s2的位置并替换为s3 下面是代码 #include<stdio.h> #include<string.h> int main(void) { char S1[10]="abababab";//因为要修改s1，所以要用字符数组，而...

将一段压缩后的字符串解压缩，并排序输出。压缩的字符串中，每个子串的后面跟一个数字表示该字串出现的次数,相同次数的字串按ASCII排序

qq_15694721的博客

09-05

1019

输入 abc3c5，输出cccccabcabcabc 输入ab3c3 ,输出cccababab import java.util.ArrayList; public class Main{ public static void main(String[]args){ String str="a5A5d4b4a2c3aa3"; System.out.println(jieya(...

KMP算法中next函数的改进

weixin_43886377的博客

03-01

1468

由KMP算法可以知道，next数组是用来标记在这个字符之前最多有多少个字符与字符串开头的字符相同，以便找到在字符串匹配的时候，如果不匹配了指针需要回退的位置。KMP算法用于模式匹配已经很高效了，但是在某些情况下也有不足，比如说在字符串aaabaaaab中匹配aaaab，我们由next数组可以知道，模式串aaaab的next数组依次为01234，因此目标串aaabaaaab与模式串aaaab在匹配的...

c/c++程序之_KMP字符串模式匹配详解