KMP

本文详细介绍了KMP算法,包括最长前缀和最长后缀的概念、子串与子序列的区别,以及如何求解next数组。同时,给出了KMP算法的过程及Java代码实现,以及暴力求解KMP的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

KMP

一、最长前缀、最长后缀

1. 前缀、后缀

概念:前缀,除了最后一个字符以外,一个字符串的全部头部组合;后缀,除了第一个字符以外,一个字符串的全部尾部组合。

eg: str1 = “abcabcd”

  • 'a’前缀,后缀为空集,共有元素为0
  • 'ab’前缀[a],后缀[b],共有元素为0
  • 'abc’前缀[a, ab],后缀[bc, c],共有元素为0
  • ‘abca’前缀[a, ab, abc],后缀[bca, ca, a],共有元素为’a’,共有元素长度为1
  • ‘abcab’前缀[a, ab, abc, abca],后缀[bcab, cab, ab, b],共有元素为’ab’,共有元素长度为2
  • ‘abcabc’前缀[a, ab, abc, abca, abcab],后缀[bcabc, cabc, abc, bc, c],共有元素为’abc’, 共有元素长度为3
  • ‘abcabcd’前缀[a, ab, abc, abca, abcab, abcabc],后缀[bcabcd, cabcd, abcd, bcd, cd, d],共有元素为’abc’, 共有元素长度为3
2. 子串、子序列
  • 子串是连续的,一个字符串的最大子串是它本身
  • 子序列可以连续也可以不连续
3. 最长前缀、最长后缀

最长前缀、最长后缀匹配长度为字符串中某一元素(索引为i)的最长共有元素长度

eg: str2 = “aaaaab”
字符’b’的最长共有元素长度为4

二、 next[]求解

求pat串中每一个字符的最长前缀、最长后缀
注意:
next[0] = -1
next[1] = 0
str1 = “ababac”
next_str1 = [-1, 0, 0, 1, 2, 3]
str2 = “abcabcababaccc”
next_str2 = [-1, 0, 0, 0, 1, 2, 3, 4, 5, 1, 2, 1, 0, 0]

在这里插入图片描述

求解pat串的java代码
    /*
     * 根据pat串获得next[]
     * */
    public static int[] getNextArray(char[] pat) {
        if (pat.length == 1) {
            return new int[]{-1};
        }
        int[] next = new int[pat.length];
        next[0] = -1;
        next[1] = 0;
        int i = 2;
        //cn指的是跳到的位置
        int cn = 0;
        while (i < next.length) {
            //cn=0时,如果1位置的值和0位置的值相等
            if (pat[i - 1] == pat[cn]) {
//                next[i++] = ++cn;
                next[i] = ++cn;
                i++;
            } else if (cn > 0) {
//                注意这里:i没有发生变化,可多次向前循环
                cn = next[cn];
            } else {
//                next[i++] = 0;
                next[i] = 0;
                i++;
            }
        }
        return next;
    }

三、 KMP算法过程

KMP加速流程

在这里插入图片描述

java代码
    public static int getIndexOf(String str1, String str2) {
        if (str1 == null || str2 == null || str2.length() < 1 || str1.length() < str2.length()) {
            return -1;
        }
        char[] txt = str1.toCharArray();
        char[] pat = str2.toCharArray();

        int i1 = 0;
        int i2 = 0;
        int[] next = getNextArray(pat);
        while (i1 < txt.length && i2 < pat.length) {
            if (txt[i1] == pat[i2]) {
                //txt和pat串一起移动
                i1++;
                i2++;
            } else if (next[i2] == -1) {
                //txt和pat串从头匹配
                i1++;
            } else {
                //pat串移动
                i2 = next[i2];
            }
        }
        return i2 == pat.length ? i1 - i2 : -1;
    }

四、暴力求解KMP算法

public static int search(String pat, String txt){
        int j, M = pat.length();
        int i, N = txt.length();
        for (i = 0, j = 0; i < N && j < M; i++){
            if(txt.charAt(i) == pat.charAt(j))
                j++;
            else {
                i -= j;
                j = 0;
            }
        }
        if(j == M)
            return i - M;
        else
            return N;
    }
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值