KMP算法详解:
KMP算法之所以叫做KMP算法是因为这个算法是由三个人共同提出来的,就取三个人名字的首字母作为该算法的名字。其实KMP算法与BF算法的区别就在于KMP算法巧妙的消除了指针i的回溯问题,只需确定下次匹配j的位置即可,使得问题的复杂度由O(mn)下降到O(m+n)。
在KMP算法中,为了确定在匹配不成功时,下次匹配时j的位置,引入了next[]数组,next[j]的值表示P[0...j-1]中最长后缀的长度等于相同字符序列的前缀。
对于next[]数组的定义如下:
1) next[j]=-1 j=0
2) next[j]=max k:0<k<j P[0...k-1]=P[j-k,j-1]
3) next[j]=0 其他
如:
P a b a b a
j 0 1 2 3 4
next -1 0 0 1 2
即next[j]=k>0时,表示P[0...k-1]=P[j-k,j-1]
因此KMP算法的思想就是:在匹配过程称,若发生不匹配的情况,如果next[j]>=0,则目标串的指针i不变,将模式串的指针j移动到next[j]的位置继续进行匹配;若next[j]=-1,则将i右移1位,并将j置0,继续进行比较。
题目:
1.给定一个字符串,问最多是多少个相同子串不重叠连接构成。
若L%(L-next[L])==0,n = L/(L-next[L]),else n = 1
及循环节为L/(L-next[L])
2.给出一个字符串A,求该字符串的所有前缀中有多少个前缀SA= s^n(n>1)
对于任何一个长度为len的前缀,如果其存在循环节,则有kmp大法可知循环节长度为len-next[len],这样的话首先预处理出next数组,之后枚举所有前缀判断其是否存在循环即可
#include<cstdio>
#include<cstring>
#include<iostream>
using namespace std;
#define maxn 1111111
char a[maxn];
int nex[maxn];
int n;
int main()
{
int res=1;
while(scanf("%d",&n),n)
{
scanf("%s",a);
printf("Test case #%d\n",res++);//按格式输出
for(int i=0,j=-1;i<=n;i++,j++)
{
nex[i]=j;
while(~j&&a[i]!=a[j])
j=nex[j];
}
for(int i=2;i<=n;i++)//枚举前缀
{
if(i%(i-nex[i])==0)//存在循环节
{
int count=i/(i-nex[i]);//循环次数
if(count!=1)//忽略循环一次的情况
printf("%d %d\n",i,count);
}
}
printf("\n");//按格式输出
}
return 0;
}
3.给出一个字符串A,求A有多少个前缀同时也是后缀,从小到大输出这些前缀的长度
借用KMP算法的next数组,设s的长度为n,则s串本身必定满足条件。其他满足条件的子串都有个特征,就是该子串的最后一个字符肯定与s的最后一个字符相同。这正是next数组发挥作用的时候。从n - 1位既最后一位开始回滚,若s[next[n-1]] == s[n-1],则子串s[0,1,2,...,next[n-1]]是满足条件的子串。然后判断s[next[next[n-1]]] == s[n-1]是否成立,这样一直回滚,直到next[next[.....next[n-1]]] == -1为止。把答案从大到小存下来,再从小到大输出即可
#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std;
int Next[400005];
char str[400005];
int ans[400005];
int cnt;
int len;
void getNext()
{
Next[0] = -1;
int i = 0, j = -1;
while (i < len)
{
if (j == -1 || str[i] == str[j])
{
++i;
++j;
Next[i] = j;
}
else j = Next[j];
}
}
int main()
{
while (scanf("%s", str) != EOF)
{
len = strlen(str);
getNext();
cnt = 0;
int t = Next[len - 1];
while (t != -1)
{
if (str[t] == str[len - 1]) ans[cnt++] = t + 1;
t = Next[t];
}
for (int i = cnt - 1; i >= 0; --i)
{
printf("%d ", ans[i]);
}
printf("%d\n", len);
}
return 0;
}