寻找最大匹配串:
核心是找到next数组,next数组保存的是最长公共前后缀的长度,如果在A[i]处匹配失败,我们可以通过查找next[i]来寻找出已经匹配上的点,比如说:next[i]等于3,说明字符串前三个和从i向前数三个字符是一样的,这样就可以直接把匹配的字符串头定位到i前面三个的位置,就不用每次移动一个了,但是如果字符串直接没有公共前后缀的话,和一次比一个也没区别。
next数组的计算:KMP算法主要是找到next数组来计算下一次字符串应该要匹配的位置。假设0~i已经知道了,next[i+1]的值,如果i+1位置的字符和next[i]+1位置处的字符一样,就等于next[i]+1;如果不等,就应该分割长度为next[i]长度的公共前后缀字符串,比如next[i]等于5,i+1位置的字符与next[i]+1=6位相比,如果不等,就应该找小于5的公共前后缀在进行比较;也就是next[5]+1的位置,比如next[5]=3,说明前五个有3个是和后面一样的,比较3+1位置和i+1位置的字符,字符相等的话next[i+1]就等于4,也就是说最多匹配到三个,第四个能匹配i+1;也就是说找到前面最大能匹配的时候,每一次检查最大匹配后面能不能与i+1匹配,如果能就得到结果,不能就继续寻找。
下面的代码是copy的,原文的图我看不太董,他的数组下标和值分别以0,1开始,所以和我的定义不一样。
http://blog.youkuaiyun.com/yutianzuijin/article/details/11954939/
next数组计算:
public int[] getNext(String b)
{
int len=b.length();
int j=0;
int next[]=new int[len+1];//next表示长度为i的字符串前缀和后缀的最长公共部分,从1开始
next[0]=next[1]=0;
for(int i=1;i<len;i++)//i表示字符串的下标,从0开始
{//j在每次循环开始都表示next[i]的值,同时也表示需要比较的下一个位置
while(j>0&&b.charAt(i)!=b.charAt(j))j=next[j];
if(b.charAt(i)==b.charAt(j))j++;
next[i+1]=j;
}
return next;
}
字符串匹配:
public void search(String original, String find, int next[]) {
int j = 0;
for (int i = 0; i < original.length(); i++) {
while (j > 0 && original.charAt(i) != find.charAt(j))
j = next[j];
if (original.charAt(i) == find.charAt(j))
j++;
if (j == find.length()) {
System.out.println("find at position " + (i - j));
System.out.println(original.subSequence(i - j + 1, i + 1));
j = next[j];
}
}
}