核心思想:
在每次失配时,不是将模板串移动到下一位、对比串从头再重新比对,而是通过
“部分匹配值表”即:next[],来跳过大多数不匹配步骤。
next[]:
存储当前位置的前缀和后缀相同的最大长度
前缀与后缀:
以 abcde 为例:
前缀:a、ab、abc、abcd
后缀: e、de、cde、bcde
设: p: abaab
p[1~size] 12345
next[5]=2
"ab"="ab"
12 45
p[ 1,next[j] ] ==p[ j-next[j]+1,j]
kmp步骤
(1)求next数组
(2)匹配字符串
(先讲第二步)
//假设已经求好了next[]
//设模板串为 s[]
//设对比串为 p[]
//s、p都是从下标为1开始储存字符串
//i=1,j=0 每次s[i]和p[j+1]比较
//s[a,b]=p[1,j],且s[i] != p[j+1]
//此时应将p串往后移动重新匹配
//但并不是移动一个单位,而是直接移动到下一次能匹配的位置
//将p[1]移动到 j-next[j]+1,j更新为naxt[j]
//再比较i与j+1,成功则 i++,j++
//反之 j=next[j],直至j==m
for(int j=0,i=1;i<=n;i++)
{
while(j!=0&&s[i]!=p[j+1]) j=next[j];
if(p[j+1]==s[i]) j++;
if(j==m)
{
break;
}
}
next数组代码实现
for(int i = 2, j = 0; i <= m; i++)
{
while(j && p[i] != p[j+1]) j = next[j];
if(p[i] == p[j+1]) j++;
next[i] = j;
}