KMP算法(Java)

简介

KMP算法是一种字符串匹配算法,相对于BF算法,KMP算法的效率更高,当BF算法中失配时,主串与模式串都会回溯,效率较低。KMP算法匹配失配时,只需要将模式串回溯到适当的位置。

next数组

当失配时,模式串会回溯到一定的位置,回溯的位置取决于next数组。

next数组的代码

public static int[] getNext(String p){
        int[] next=new int[p.length()];
        int j=0,k=-1;//j为p中字符的下标,k为next数组的值
        next[0]=-1;//下标为0是为-1

        while( j < p.length() - 1){
            if (k==-1 || p.charAt(j)==p.charAt(k)){
                j++;
                k++;
                next[j] = k;
            }else{
                k = next[k];//
            }
        }
        return next;
    }

举一个例子

举一个例子
当j=0时,此时的next[0]=-1,当j=3时,此时的p[0]p[1]=p[1]p[2],所以当在j=3失配时,j回溯到j=2的位置。以此类推,当下标为j时,若是存在p[j]…p[j-k-1]=p[k]…p[0],则回溯到k+1的位置,否则的话,回溯到j=0的位置。在j=4时,不存在p[j]…p[j-k-1]=p[k]…p[0],所以回溯到下标为0的位置,当j=5时,存在p[0]=p[4],所以回溯到下标0+1的位置…

KMP算法

public static int KMPmethod(String mainStr,String pattern){
        int i=0,j=0;//i为mainstr的下标
        int[] next=getNext(pattern);
        while (i<mainStr.length() && j<pattern.length()){
            if (j==-1 || mainStr.charAt(i)==pattern.charAt(j)){
                i++;
                j++;
            }else {
                j=next[j];
            }
            if (j == pattern.length()){
                return i-j;
            }
        }
        return -1;
    }
### KMP算法简介 KMP算法是由D.E.Knuth、J.H.Morris和V.R.Pratt于1977年共同提出的字符串匹配算法,也被称为Knuth-Morris-Pratt算法[^1]。这种算法的核心在于通过构建部分匹配表(通常称为`next[]`数组),使得当发生不匹配时可以跳过一些不必要的比较操作,从而提高效率。 ### 部分匹配表(`next[]`)的作用 为了实现高效的字符匹配过程,KMP算法预先处理模式串P,计算出一个辅助数组——即前缀函数π(或称作失配函数),这个数组记录着对于每一个位置i,在此之前最长相等的真前后缀长度。具体来说就是如果存在k<i使p0..pk−1=pi−k..pi−1,则定义π[i]=k;否则取最大可能的小于此条件下的值作为π[i]。这部分逻辑体现在Java代码中便是构造所谓的`getNext()`方法来填充`next[]`数组[^3]。 ### Java代码示例 下面给出一段完整的基于上述原理编写的用于执行KMP模式搜索功能的标准Java程序: ```java public class KMPSearch { private static int[] getNext(String pattern){ int j = -1; int[] next = new int[pattern.length()]; next[0]=-1; // 初始化第一个元素为-1 for(int i=1;i<pattern.length();i++){ while(j>=0 && pattern.charAt(i-1)!=pattern.charAt(j)){ j = next[j]; } if(pattern.charAt(i)==pattern.charAt(j+1)) ++j; next[i]=(char)(j); } return next; } public static List<Integer> search(String text,String pattern){ List<Integer> result=new ArrayList<>(); int m=text.length(); int n=pattern.length(); /* 构建next数组 */ int[] next=getNext(pattern); int i=0,j=-1; while(i<m){ while(j>-1&&text.charAt(i)!=pattern.charAt(j+1)) j=next[j]; if(text.charAt(i)==pattern.charAt(j+1)) ++j; if(j==n-1){ result.add(i-n+1); // 记录下找到的位置 j=next[j]; // 继续寻找下一个可能出现的地方 } ++i; } return result; } } ``` 这段代码实现了两个主要的功能:一是获取给定模式串的部分匹配值列表`getNext()`;二是利用这些信息完成实际的目标文本扫描工作`search()`。每当发现一个新的匹配项时就会将其起始索引加入到返回的结果集中去[^2]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值