算法思路:
假设文本串S匹配到 i 位置,模式串P匹配到 j 位置如果j = -1,或者当前字符匹配成功(即S[i] == P[j]),则令i++,j++,继续匹配下一个字符;如果j != -1,且当前字符匹配失败(即S[i] != P[j]),则令 i 不变,j = next[j]。此举意味着失配时,模式串P相对于文本串S向右移动了j - next [j] 位。
next数组的求解:
一、通过寻找最长公共子串来求next数组
1.寻找最长前缀后缀
例如:给定模式串 abab 各个子串前后缀分别如下所示:
子串 前缀 后缀 最大公共元素长度
a null null 0
ab a b 0
aba a,ab ba,a 1
abab a,ab,aba bab,ab,b 2
模式串子串前后缀对应最大公共元素长度表如下
a b a b
0 0 1 2
2.求next 数组:
next 考虑的是除当前字符外的最长相同前后缀,所以只需将第1步求得的值整体右移一位,初始值为-1即可,如下表所示:
a b a b
-1 0 0 1
二、通过递推来求next数组:
1.对于值k,已有p0 p1, ..., pk-1 = pj-k pj-k+1, ..., pj-1,相当于next[j] = k
next[j] = k 代表p[j] 之前的模式串子串中,有长度为k 的相同前缀和后缀
如对于:a b a b k = 2 j = 4
2.已知next [0, ..., j],如何求出next [j + 1]呢?
a.若p[k] == p[j],则next[j + 1 ] = next [j] + 1 = k + 1;
b.若p[k ] ≠ p[j],如果此时p[ next[k] ] == p[j ],则next[ j + 1 ] = next[k] + 1,
否则继续递归前缀索引k = next[k],而后重复此过程。
下面来看代码:
public class KMP {
/**
* 法一:暴力求解
* @param s
* @param p
* @return
*/
public int commonSearch(String s, String p) {
char[] sarr = s.toCharArray();
char[] parr = p.toCharArray();
int i = 0;
int j = 0;
int slen = sarr.length;
int plen = parr.length;
while(i < slen && j < plen) {
if(sarr[i] == parr[j]) {
i++;
j++;
} else {
i = i - (j - 1);
j = 0;
}
if(j == plen) return i - j;
}
return -1;
}
public int searchByKMP(String s, String p) {
char[] sarr = s.toCharArray();
char[] parr = p.toCharArray();
int i = 0;
int j = 0;
int slen = sarr.length;
int plen = parr.length;
int[] next = getNext(p);
while(i < slen && j < plen) {
if(j == -1 || sarr[i] == parr[j]) {
i ++;
j ++;
} else {
j = next[j];
}
if(j == plen) return i - j;
}
return -1;
}
/**
* 通过递推求next数组
* @param p
* @return
*/
private int[] getNext(String p) {
char[] parr = p.toCharArray();
int plen = parr.length;
int[] next = new int[plen];
next[0] = -1;
int k = -1;
int j = 0;
while( j < plen - 1) {
// parr[k]代表前缀 parr[j]代表后缀
if(k == -1 || parr[k] == parr[j]) {
++k;
++j;
next[j] = k;
} else {
k = next[k];
}
}
return next;
}
public static void main(String[] args) {
KMP k = new KMP();
String s = "ABCDABCDABDE";
String p = "ABCDABD";
System.out.println(k.commonSearch(s, p));
System.out.println(k.searchByKMP(s, p));
}
}
一篇更为详细的kmp讲解: https://blog.youkuaiyun.com/v_july_v/article/details/7041827