KMP算法(Python)

进阶的做法就是KMP算法,当然暴力也能ac。

KMP主要用一个nex列表,nex[i]存储(模式串needle中)从第0个到i个字符串s中的一个相等前后缀的最大长度。比如说对于aabaa来说,最大长度应该是(前缀aa)和后缀(aa)的长度2,再比如说对于aabaaba来说,最大长度为(前缀aaba)和后缀(aaba)的长度4。

下图是董晓算法的例子,不过他是从1开始计数,我们Python都是0开始计数。

对上图,双指针分别在模式串上滑动,一个j从前缀开始,一个i从后缀开始。

当i=9,j+1=6的时候,两者不匹配,就是代码中, p[j] !=p[j+1],让j=nex[j],意思是发现aabaaa和aabaab不匹配了,现在找到aabaa的(相等前后缀的最大长度),那就是aa,j跳到2的位置,相对于j = nex[j]。为什么要找到aabaa的(相等前后缀的最大长度),因为现在aabaa+a与aabaa+b不匹配了,需要找到与aabaa+b相匹配的最大前缀长度,那么需要对aabaa进行缩少,

目前在最大长度的情况下,前缀是aabaa,后缀是aabaa,分别编号1,2,3,4,5

找到aabaa的(相等前后缀的最大长度)相对于找到1,2(aa)和4,5(aa)相等,再考虑aa+a和aa+b匹不匹配,看起来不匹配,再找到aa的(相等前后缀的最大长度)为(a),那么a+a显然和a+a相匹配。看不懂还是去b沾:F03【模板】KMP 算法_哔哩哔哩_bilibili

下面是KMP的整个算法:

class Solution:
    def strStr(self, haystack: str, needle: str) -> int:
        s = haystack
        p = needle
        leth = len(p)
        nex = [-1]*leth
        j = -1
        nex[0] = 0
        for i in range(1, leth):
            while j != -1 and p[i] != p[j+1]:
                j = nex[j] - 1
            if p[i] == p[j+1]:
                j += 1
            nex[i] = j + 1
        x = -1
        for idx in range(len(s)):
            while x != -1 and s[idx] != p[x+1]:
                x = nex[x] - 1
            if s[idx] == p[x+1]:
                x += 1
            if x == leth -1:
                return idx - leth + 1
        return -1

KMP算法全称Knuth-Morris-Pratt算法,是一种用于字符串匹配的高效算法。它通过构建部分匹配表(也称为失配函数或最长公共前后缀长度),避免了传统暴力匹配中的回溯操作,提高了搜索效率。在Python中,我们可以按照以下步骤实现KMP算法: 1. 定义部分匹配表(P):计算每个模式字符前缀和后缀的最长公共前后缀长度,用于指导搜索过程。 2. 创建模式字符串S,并初始化匹配指针i和模式指针j。 3. 当j小于模式长度时,比较S[i]和S[j]: - 如果它们相等,i 和 j 都加一; - 如果它们不相等: - 如果j>0,从P[j]开始检查是否能跳过当前不匹配的位置,找到合适的偏移量; - 如果存在,将j设置为对应的偏移量; - 否则,i增加1。 4. 搜索结束后,如果i等于原始字符串S的长度,说明找到了一个匹配;否则,没有找到匹配。 下面是简单的Python代码示例: ```python def get_next(pattern): next_table = [0] * len(pattern) j = 0 for i in range(1, len(pattern)): while j > 0 and pattern[i] != pattern[j]: j = next_table[j - 1] if pattern[i] == pattern[j]: j += 1 next_table[i] = j return next_table def kmp_search(text, pattern): text_len = len(text) pattern_len = len(pattern) next_table = get_next(pattern) i, j = 0, 0 while i < text_len: if text[i] == pattern[j]: i += 1 j += 1 elif j > 0: j = next_table[j - 1] else: i += 1 return j == pattern_len # 使用示例 text = "ABABDABACDABABC" pattern = "ABACD" if kmp_search(text, pattern): print(f"Pattern '{pattern}' found in text.") else: print(f"Pattern '{pattern}' not found in text.")
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值