KMP
一、最长前缀、最长后缀
1. 前缀、后缀
概念:前缀,除了最后一个字符以外,一个字符串的全部头部组合;后缀,除了第一个字符以外,一个字符串的全部尾部组合。
eg: str1 = “abcabcd”
- 'a’前缀,后缀为空集,共有元素为0
- 'ab’前缀[a],后缀[b],共有元素为0
- 'abc’前缀[a, ab],后缀[bc, c],共有元素为0
- ‘abca’前缀[a, ab, abc],后缀[bca, ca, a],共有元素为’a’,共有元素长度为1
- ‘abcab’前缀[a, ab, abc, abca],后缀[bcab, cab, ab, b],共有元素为’ab’,共有元素长度为2
- ‘abcabc’前缀[a, ab, abc, abca, abcab],后缀[bcabc, cabc, abc, bc, c],共有元素为’abc’, 共有元素长度为3
- ‘abcabcd’前缀[a, ab, abc, abca, abcab, abcabc],后缀[bcabcd, cabcd, abcd, bcd, cd, d],共有元素为’abc’, 共有元素长度为3
2. 子串、子序列
- 子串是连续的,一个字符串的最大子串是它本身
- 子序列可以连续也可以不连续
3. 最长前缀、最长后缀
最长前缀、最长后缀匹配长度为字符串中某一元素(索引为i)的最长共有元素长度
eg: str2 = “aaaaab”
字符’b’的最长共有元素长度为4
二、 next[]求解
求pat串中每一个字符的最长前缀、最长后缀
注意:
next[0] = -1
next[1] = 0
str1 = “ababac”
next_str1 = [-1, 0, 0, 1, 2, 3]
str2 = “abcabcababaccc”
next_str2 = [-1, 0, 0, 0, 1, 2, 3, 4, 5, 1, 2, 1, 0, 0]
求解pat串的java代码
/*
* 根据pat串获得next[]
* */
public static int[] getNextArray(char[] pat) {
if (pat.length == 1) {
return new int[]{-1};
}
int[] next = new int[pat.length];
next[0] = -1;
next[1] = 0;
int i = 2;
//cn指的是跳到的位置
int cn = 0;
while (i < next.length) {
//cn=0时,如果1位置的值和0位置的值相等
if (pat[i - 1] == pat[cn]) {
// next[i++] = ++cn;
next[i] = ++cn;
i++;
} else if (cn > 0) {
// 注意这里:i没有发生变化,可多次向前循环
cn = next[cn];
} else {
// next[i++] = 0;
next[i] = 0;
i++;
}
}
return next;
}
三、 KMP算法过程
KMP加速流程
java代码
public static int getIndexOf(String str1, String str2) {
if (str1 == null || str2 == null || str2.length() < 1 || str1.length() < str2.length()) {
return -1;
}
char[] txt = str1.toCharArray();
char[] pat = str2.toCharArray();
int i1 = 0;
int i2 = 0;
int[] next = getNextArray(pat);
while (i1 < txt.length && i2 < pat.length) {
if (txt[i1] == pat[i2]) {
//txt和pat串一起移动
i1++;
i2++;
} else if (next[i2] == -1) {
//txt和pat串从头匹配
i1++;
} else {
//pat串移动
i2 = next[i2];
}
}
return i2 == pat.length ? i1 - i2 : -1;
}
四、暴力求解KMP算法
public static int search(String pat, String txt){
int j, M = pat.length();
int i, N = txt.length();
for (i = 0, j = 0; i < N && j < M; i++){
if(txt.charAt(i) == pat.charAt(j))
j++;
else {
i -= j;
j = 0;
}
}
if(j == M)
return i - M;
else
return N;
}