文章目录
KMP
KMP算法是一个效率高的字符串匹配算法。一般比较两个串的时间复杂度是两个字符串长度之积,效率并不是很高,而KMP的时间复杂度是两个字符串长度之和。
比如给你两个字符串,主串是:abbadabbc,模式串 abbcdabb KMP好处在于能够使模式串尽可能地往后面移动,主串匹配地位置不用重复去匹配,借助 Next[]数组,但是数组命名不能是 next,否则 oj 提交会报错
KMP核心思想: 尽可能地将模式串向后移动,减少匹配时间
例如模式串 abbcdabba,发现 abb 有重复地位置,那么直接将模式串首位置移动到后面部分地首位置即可。
求Next[]
后缀:从某个位置开始到末尾的一个子串。
前缀:从首部开始到任意位置。
就是一个模式串自匹配地过程,以 abbcdabb 为例
模式串自匹配,求 Next[]
void Get_next(int p[],int n)
{
ne[0]=ne[1]=0;
for(int i=1;i<= n;++i) //自匹配
{
int j=ne[i];
while(j&&p[i]!=p[j]) j=ne[j]; //匹配失败,返回当前后缀的前缀
ne[i+1]=(p[i]==p[j])?j+1:0;
}
// for(int i=1;i<=n;++i) printf("ne[%d]=%d ",i,ne[i]);puts("");
}
Kmp 主串与子串匹配
void Kmp(int s[],int ls,int p[],int lp) //s:主串 p:子串,询问 p 是否包含于 s
{
int last=-1;
Get_next(p,lp); //求 next[] 数组
for(int i=0,j=0;i<ls;i++)
{
while(j&&s[i]!=p[j]) j=ne[j];
if(s[i]==p[j]) j++;
if(j==lp) {
//匹配成功
last = i+2-j;
printf("%d\n",last);
return;
}
}
puts("-1");
return;
}
题目集
亲和串
题目大意
人随着岁数的增长是越大越聪明还是越大越笨,这是一个值得全世界科学家思考的问题,同样的问题Eddy也一直在思考,因为他在很小的时候就知道亲和串如何判断了,但是发现,现在长大了却不知道怎么去判断亲和串了,于是他只好又再一次来请教聪明且乐于助人的你来解决这个问题。
亲和串的定义是这样的:给定两个字符串s1和s2,如果能通过s1循环移位,使s2包含在s1中,那么我们就说s2 是s1的亲和串。
Input
本题有多组测试数据,每组数据的第一行包含输入字符串s1,第二行包含输入字符串s2,s1与s2的长度均小于100000。
Output
如果s2是s1的亲和串,则输出"yes",反之,输出"no"。每组测试的输出占一行。
样例输入
AABCD
CDAA
ASD
ASDF
样例输出
yes
no
#include <cstdio>
#include <cstring>
using namespace std;
const int maxn=1e5+7;
char s[maxn<<1],t[maxn];
int ne[maxn];
void Get_next(char p[],int n)
{
ne[0]=ne[1]=0;
for(int i=1;i<= n;++i) //自匹配
{
int j=ne[i];
while(j&&p[i]!=p[j]) j=ne[j]; //匹配失败,返回当前后缀的前缀
ne[i+1]=(p[i]==p[j])?j+1:0;
}
}
void Kmp(char s[],int ls,char p[],int lp) //s:主串 p:子串,询问 p 是否包含于 s
{
Get_next(p,lp); //求 next[] 数组
for(int i=0,j=0;i<ls;i++)
{
while(j&&s[i]!=p[j]) j=ne[j];
if(s[i]==p[j]) j++;
if(j==lp) {
//匹配成功
puts("yes");
return;
}
}
puts("no");
return;
}
int main()
{
while(~scanf(" %s %s",s,t))
{
memset(ne,0,sizeof ne);
int ls=strlen(s),lt=strlen(t);
int idx=ls;
if(ls<lt)
while(ls<lt){
for(int i=1;i<=ls;++i) s[idx++]=s[i];
ls=idx;
}
for(int i=0;i<ls;++i) s[idx++]=s[i];
Kmp(s,idx,t,lt);
}
return 0;
}
Period
题目大意
给你一个 n 和一个长度为 n 的字符串,让你求找这个字符串中的子串重复出现的次数及其长度,长度是重复出现多少次数的整个长度。
输入格式
输入有多组数据,输入一个 n 和 字符串 s,当 n == 0 时输入结束。
输出格式
输出Test case #,第几组数据,下面输出符合的数据,循环子串长度和循环次数,每组数据占一行。每个Test之间有个换行
样例输入
3
aaa
12
aabaabaabaab
0
样例输出
Test case #1
2 2
3 3
Test case #2
2 2
6 2
9 3
12 4
#include <cstdio>
#include <cstring>
using namespace std;
const int maxn=1e6+7;
char s[maxn];
int ne[maxn];
void Get_next(char p[],int n)
{
ne[0]=ne[1]=0;
for(int i=1;i<=n;++i) //自匹配
{
int j=ne[i];
while(j&&p[i]!=p[j]) j=ne[j]; //匹配失败,返回当前后缀的前缀
ne[i+1]=(p[i]==p[j])?j+1:0;
}
}
int main()
{
int n,cnt=0;
while(~scanf("%d",&n)&&n)
{
memset(ne,0,sizeof ne);
scanf("%s",s);
Get_next(s,n);
printf("Test case #%d\n",++cnt);
for(int i=2;i<=n;++i)
{
int l=i-ne[i];
if(!(i%l)&&ne[i]) printf("%d %d\n",i,i/l);
}
printf("\n");
}
return 0;
}
Number Sequence
题目大意
给你一个数组a 和 b ,问 b 是不是 a 的子集。
输入格式
输入一个T,代表有 T 组测试。
输入一个 N N N 和 M M M (1 ≤ \leq ≤ M M M