扩展kmp

最新推荐文章于 2022-05-01 18:16:17 发布

转载最新推荐文章于 2022-05-01 18:16:17 发布 · 54 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/jianglangcaijin/p/5992782.html

问题描述
给定串S和T，设长度分别为n,m，依次计算出extend[0~n-1]，extend[i]表示S的后缀S[i,n-1]与T的最长公共前缀。

算法描述

为了计算extend数组，我们先计算一个数组next[0~m-1],next[i]表示T的后缀T[i,m-1]与T[0,m-1]的最长公共前缀。

假设已经计算出了next数组。现在借助于next数组，从前向后计算S的每个位置的extend值。假设当前遍历到位置i，即extend[0~i-1]都已经计算完。对于所有的$j\in [0,i-1]$

S串： 0 1 2 … a … i-1 i … p …

对于a这个位置，有S[a,p]=T[0,p-a]，那么有S[i,p]=T[i-a,p-a]

要求extend[i]，即S[i,n-1]匹配T[0,m-1]，我们可以先用T[i-a,m-1]来匹配T[0,m-1]，这正是next[i-a]表示的含义：T中位置i-a开始的后缀跟T的最长公共前缀长度。令L=next[i-a]，分以下两种情况讨论：
第一种 $i+L<p$

第二种 $i+L\geq p$

p+1及其之后我们不知道是不是匹配，所以要逐个比较。

下面是计算extend的代码。

 1 void GetExtend(
 2         const char* S,const int nSLen,
 3         const char* T,const int nTLen,
 4         const int *Next,
 5         int *Extend)
 6 {
 7     int a,p,j=-1;
 8     for(int i=0;i<nSLen;++i,--j)
 9     {
10         if(j<0||i+Next[i-a]>=p)
11         {
12             if(j<0) j=0,p=i;
13             while(p<nSLen&&j<nTLen&&S[p]==T[j]) ++j,++p;
14             Extend[i]=j;
15             a=i;
16         }
17         else Extend[i]=Next[i-a];
18     }
19 }

对于next的求法，显然与上面是一个过程，只是两个串一样：

 1 void GetNext(
 2         const char* S,const int nSLen,
 3         int *Next)
 4 {
 5     int a,p,j=-1;
 6     Next[0]=nSLen;
 7     for(int i=1;i<nSLen;++i,--j)
 8     {
 9         if(j<0||i+Next[i-a]>=p)
10         {
11             if(j<0) j=0,p=i;
12             while(p<nSLen&&S[p]==S[j]) ++j,++p;
13             Next[i]=j;
14             a=i;
15         }
16         else Next[i]=Next[i-a];
17     }
18 }

转载于:https://www.cnblogs.com/jianglangcaijin/p/5992782.html