一、子串的比较
1.匹配到f发现配对失败,但f前面的子串:abeab有最大长度为2的前缀和后缀(ab),所以回退到位置2。
前缀:包含首字母,不含尾字母
后缀:包含尾字母,不含首字母
如:aabaaf
前缀:a,aa,aab,aaba,aabaa
后缀:f,af,aaf,baaf,abaaf
则前缀和后缀相等为0。
2.为什么要考虑前缀和后缀呢?
答:先看刚刚的abeabf,你发现f的前面有ab,而整个子串的开头也有ab,当f不匹配时,前面2个字母是曾经匹配过了,不需要再从头开始匹配,这就是前缀和后缀的用武之地。
二、如何构建next数组
1. (1)初始化next[0]=0,j=0,i=1
(2)如果P[j]==P[i],则next[i]=j+1,i++,j++
2.(1)如果P[j] != P[i]
则将j指向前一位置的next对应的值,即j=next[j-1]
(2)重复进行,直到P[j]==P[i]或者j==0
(3)如果j==0,P[j]和P[i]还是不等,则next[i]=0,i往后移,j不变。
三、代码实现
求next
public static int [] getNext(String str){
int next[]=new int[str.length()];
next[0]=0;
for(int j=0,i=1;i<str.length();i++){
while (j>0 && str.charAt(j)!=str.charAt(i)){
j=next[j-1];
}
if (str.charAt(j)==str.charAt(i)){
j++;
}
next[i]=j;
}
return next;
}
匹配
public static int KMP_compare(String str,String dest,int []next){
for (int i = 0,j=0; i < str.length(); i++) {
//匹配不成功
while(j>0 && str.charAt(i)!=dest.charAt(j)){
j=next[j-1];
}
//匹配成功
if (str.charAt(i)==dest.charAt(j)){
j++;
}
//匹配结束
if(j==dest.length()){
return i-j+1; //返回str的初始位置
}
}
return -1;//不匹配
}