字符串匹配——KMP算法

 算法思路:
     假设文本串S匹配到 i 位置,模式串P匹配到 j 位置如果j = -1,或者当前字符匹配成功(即S[i] == P[j]),则令i++,j++,继续匹配下一个字符;如果j != -1,且当前字符匹配失败(即S[i] != P[j]),则令 i 不变,j = next[j]。此举意味着失配时,模式串P相对于文本串S向右移动了j - next [j] 位。

next数组的求解:
 一、通过寻找最长公共子串来求next数组
 1.寻找最长前缀后缀 
 例如:给定模式串 abab 各个子串前后缀分别如下所示:
  子串        前缀                          后缀                    最大公共元素长度
  a               null                          null                          0
  ab             a                              b                              0
  aba           a,ab                        ba,a                           1
  abab         a,ab,aba                bab,ab,b                      2
模式串子串前后缀对应最大公共元素长度表如下
 a  b  a  b
 0  0  1  2
 2.求next 数组:
next 考虑的是除当前字符外的最长相同前后缀,所以只需将第1步求得的值整体右移一位,初始值为-1即可,如下表所示:
 a  b a b
-1  0 0 1 
 
 二、通过递推来求next数组:
 1.对于值k,已有p0 p1, ..., pk-1 = pj-k pj-k+1, ..., pj-1,相当于next[j] = k
 next[j] = k 代表p[j] 之前的模式串子串中,有长度为k 的相同前缀和后缀
  如对于:a b a b        k = 2 j = 4 
2.已知next [0, ..., j],如何求出next [j + 1]呢?
 a.若p[k] == p[j],则next[j + 1 ] = next [j] + 1 = k + 1;
 b.若p[k ] ≠ p[j],如果此时p[ next[k] ] == p[j ],则next[ j + 1 ] =  next[k] + 1,
 否则继续递归前缀索引k = next[k],而后重复此过程。

下面来看代码: 

public class KMP {

	/**
	 * 法一:暴力求解
	 * @param s
	 * @param p
	 * @return
	 */
	public int commonSearch(String s, String p) {
		char[] sarr = s.toCharArray();
		char[] parr = p.toCharArray();
		int i = 0;
		int j = 0;
		int slen = sarr.length;
		int plen = parr.length;
		while(i < slen && j < plen) {
		   if(sarr[i] == parr[j]) {
			   i++;
			   j++;
		   } else {
			   i = i - (j - 1);
			   j = 0;
		   }
		   if(j == plen) return i - j;
		}
		return -1;
	}
	
	public int searchByKMP(String s, String p) {
		char[] sarr = s.toCharArray();
		char[] parr = p.toCharArray();
		int i = 0;
		int j = 0;
		int slen = sarr.length;
		int plen = parr.length;
		int[] next = getNext(p);
		while(i < slen && j < plen) {
			if(j == -1 || sarr[i] == parr[j]) {
				i ++;
				j ++;
			} else {
				j = next[j];
			}
			if(j == plen) return i - j;
		}
		return -1;
	}
	
	/**
	 * 通过递推求next数组
	 * @param p
	 * @return
	 */
	private int[] getNext(String p) {
		char[] parr = p.toCharArray();
		int plen = parr.length;
		int[] next = new int[plen];
		next[0] = -1;
		int k = -1;
		int j = 0;
		while( j < plen - 1) {
			// parr[k]代表前缀  parr[j]代表后缀
			if(k == -1 || parr[k] == parr[j]) {
				++k;
				++j;
				next[j] = k;
			} else {
				k = next[k];
			}
		}
		return next;
	}
	public static void main(String[] args) {
		KMP k = new KMP();
		String s = "ABCDABCDABDE";
		String p = "ABCDABD";
		System.out.println(k.commonSearch(s, p));
		System.out.println(k.searchByKMP(s, p));
	}
}

一篇更为详细的kmp讲解: https://blog.youkuaiyun.com/v_july_v/article/details/7041827

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值