KMP算法JAVA实现

KMP算法为的是解决两个字符串匹配问题的算法,检查一个字符串是否为另一个的子串,a= “abc” , b = “aabcd” , b串里包含了一个a串,KMP算法可以以O(M+N)的复杂度找到子串在b中的位置。

下面是我通过不同博客资料最终总结出的算法:

1.首先要弄清什么是KMP算法:

请查看 阮一峰老师写的介绍KMP的博客,这是一篇真的容易懂的KMP算法介绍

点击此处跳转到文章出处

2.JAVA实现

计算出的部分匹配表与原文有所不同

public class KMP {
    public static void main(String[] args) {
        String target = "bbc abcdab abcdabd abde";// 主串
        String mode = "abcdabd";// 模式串
        char[] t = target.toCharArray();
        char[] m = mode.toCharArray();
        System.out.println(matchString(t, m)); // KMP匹配字符串
    }

    //计算部分匹配表
    public static int[] matchTable(char[] c) {
        int length = c.length;
        int[] a = new int[length];
        int i, j;
        a[0] = -1;
        i = 0;
        for (j = 1; j < length; j++) {
            i = a[j - 1];
            while (i >= 0 && c[j] != c[i + 1]) {
                i = a[i];
            }
            if (c[j] == c[i + 1]) {
                a[j] = i + 1;
            } else {
                a[j] = -1;
            }
        }
        return a;
    }
    //字符串匹配
    public static int matchString(char[] s, char[] t) {
        int[] next = matchTable(t);
        int i = 0;
        int j = 0;
        while (i <= s.length - 1 && j <= t.length - 1) {
            if (j == -1 || s[i] == t[j]) {
                i++;
                j++;
            } else {
                j = next[j];
            }
        }
        if (j < t.length) {
            return -1;
        } else
            return i - t.length; // 返回模式串在主串中的头下标
    }
}
### KMP算法简介 KMP算法是由D.E.Knuth、J.H.Morris和V.R.Pratt于1977年共同提出的字符串匹配算法,也被称为Knuth-Morris-Pratt算法[^1]。这种算法的核心在于通过构建部分匹配表(通常称为`next[]`数组),使得当发生不匹配时可以跳过一些不必要的比较操作,从而提高效率。 ### 部分匹配表(`next[]`)的作用 为了实现高效的字符匹配过程,KMP算法预先处理模式串P,计算出一个辅助数组——即前缀函数π(或称作失配函数),这个数组记录着对于每一个位置i,在此之前最长相等的真前后缀长度。具体来说就是如果存在k<i使p0..pk−1=pi−k..pi−1,则定义π[i]=k;否则取最大可能的小于此条件下的值作为π[i]。这部分逻辑体现在Java代码中便是构造所谓的`getNext()`方法来填充`next[]`数组[^3]。 ### Java代码示例 下面给出一段完整的基于上述原理编写的用于执行KMP模式搜索功能的标准Java程序: ```java public class KMPSearch { private static int[] getNext(String pattern){ int j = -1; int[] next = new int[pattern.length()]; next[0]=-1; // 初始化第一个元素为-1 for(int i=1;i<pattern.length();i++){ while(j>=0 && pattern.charAt(i-1)!=pattern.charAt(j)){ j = next[j]; } if(pattern.charAt(i)==pattern.charAt(j+1)) ++j; next[i]=(char)(j); } return next; } public static List<Integer> search(String text,String pattern){ List<Integer> result=new ArrayList<>(); int m=text.length(); int n=pattern.length(); /* 构建next数组 */ int[] next=getNext(pattern); int i=0,j=-1; while(i<m){ while(j>-1&&text.charAt(i)!=pattern.charAt(j+1)) j=next[j]; if(text.charAt(i)==pattern.charAt(j+1)) ++j; if(j==n-1){ result.add(i-n+1); // 记录下找到的位置 j=next[j]; // 继续寻找下一个可能出现的地方 } ++i; } return result; } } ``` 这段代码实现了两个主要的功能:一是获取给定模式串的部分匹配值列表`getNext()`;二是利用这些信息完成实际的目标文本扫描工作`search()`。每当发现一个新的匹配项时就会将其起始索引加入到返回的结果集中去[^2]。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值