kmp&&扩展kmp题集

本文通过几个题目详细介绍了KMP算法及其扩展应用。包括如何利用KMP求解字符串的前缀循环节、寻找子串出现次数、最大化子串在目标字符串中出现次数等问题,还涉及到字符串反转和求解循环节长度。通过实例解析,帮助理解KMP算法的实战运用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

链接:https://vjudge.net/problem/HDU-1358

题意:给定一个串,求该串的前缀是否有循环,如果有,求循环节

解析:

直接用kmp算法求next数组,然后判断循环节

#include<bits/stdc++.h>
#define N 1000025
using namespace std;
int n,m;
char p[N];
int next2[N];

void getnext()
{
    int i=0,j=-1;
    next2[0]=-1;
    while(i<m)
    {
        if(j==-1||p[i]==p[j])
        {
            next2[++i]=++j;
        }
        else {
                j=next2[j];
        }
    }
}

int main()
{
    int cas=1;
    while(scanf("%d",&m)&&m!=0)
    {
        scanf("%s",&p);
        getnext();
        printf("Test case #%d\n",cas++);

        for(int i=2;i<=m;i++)
        {
            int m=i-next2[i];
            if(i%m==0&&m!=i)
            {
                printf("%d %d\n",i,i/m);
            }
        }
        printf("\n");

    }
    return 0;
}

Oulipo

题意:

给定a串,和b串,求b串作为a的子串在a出现的个数

解析:

直接用kmp,只是匹配完不跳出,继续匹配知道匹配玩a串为止,累加匹配成功的结果

#include<bits/stdc++.h>//poj3461
#define N 1000025
using namespace std;
int n,m;
char s[N],p[N];
int next2[N];

void getnext()
{
    int i=0,j=-1;
    next2[0]=-1;
    m=strlen(p);
    while(i<m)
    {
        if(j==-1||p[i]==p[j])
        {
            next2[++i]=++j;
        }
        else {
                j=next2[j];
        }
    }

}

int kmp()
{
    int i=0,j=0,sum=0;
    getnext();
    n=strlen(s);
    while(i<n)
    {
        if(j==-1||s[i]==p[j])
        {
            j++;
            i++;
        }
        else j=next2[j];
        if(j==m)
        {
            sum++;
            j=next2[j];
        }
    }
    return sum;
}

int main()
{
    int t;
        scanf("%d",&t);
    while(t--)
    {
        scanf("%s%s",&p,&s);
        printf("%d\n",kmp());
    }
    return 0;
}

Number Sequence

模板题

#include<bits/stdc++.h>//hdu1711
#define N 1000025
using namespace std;
int n,m;
int s[N],p[N];
int next2[N];

void getnext()
{
    int i=0,j=-1;
    next2[0]=-1;
    while(i<m)
    {
        if(j==-1||p[i]==p[j])//j==-1,j已经是最左边的了,所以只能i往右移
        {
            next2[++i]=++j;//如果p[i]==p[j],呢么在已知p[i-1]==p[j-1]的情况下,next2[i]=next2[i-1];如果p[i-1]!=p[j-1],呢么j=next2[j];
        }
        else {
                j=next2[j];
        }
    }
}

int kmp()
{
    int i=0,j=0;
    getnext();
    while(i<n)
    {
        if(j==-1||s[i]==p[j])
        {
            j++;
            i++;
        }
        else j=next2[j];
        if(j==m)//已经匹配的长度j和p的长度m相等,就返回i
            return i;
    }
    return -1;
}

int main()
{
    int t;
        scanf("%d",&t);
    while(t--)
    {
        scanf("%d%d",&n,&m);
        for(int i=0;i<n;i++)
            scanf("%d",&s[i]);
        for(int i=0;i<m;i++)
            scanf("%d",&p[i]);
        if(kmp()==-1)
            printf("-1\n");
        else printf("%d\n",kmp()-m+1);
    }
    return 0;
}

链接:Camp Schedule

题意

给两个01字符串a,b

将a改成字符串c,c里的1,0的个数和a相同

使得b作为子串在c中出现次数最多

解析:

如果alen>=blen     

b中可能含有可以重叠的前缀部分,所以要求next数组,然后直接模拟就ok了

kmp计算前缀跳转,模拟生成c,循环一次要跳转daonext2[blen]上

否则 直接输出str

ac:

#include<bits/stdc++.h>
#define MAXN 500005
using namespace std;
 
char str[MAXN],ctr[MAXN];
char gtr[MAXN];
int next2[MAXN];
 
void getnext()
{
    int i=0,j=-1;
    next2[0]=-1;
    int m=strlen(ctr);
    while(i<m)
    {
        if(j==-1||ctr[i]==ctr[j])
        {
            next2[++i]=++j;
        }
        else {
                j=next2[j];
        }
    }
}
 
int main()
{
    scanf("%s",&str);
    scanf("%s",&ctr);
    int alen=strlen(str);
    int blen=strlen(ctr);
 
    if(alen>=blen)
    {
        int sum=0;
        for(int i=0;i<alen;i++)
            if(str[i]=='1')
                sum++;
        int ans=alen-sum;
        int q=0,p=0;
        getnext();
        for(int i=0,j=0;j<alen;i++,j++)
        {
            if(i==blen)//跳转
                i=next2[blen];
 
            if(q<sum&&ctr[i]=='1')//优先模拟
            {
                gtr[j]='1';
                q++;
            }
            else if(p<ans){
                gtr[j]='0';
                p++;
            }
            else{
                gtr[j]='1';
                q++;
            }
        }
        gtr[alen]='\0';
        printf("%s\n",gtr);
    }
    else
        printf("%s\n",str);
 
    return 0;
}

 

D - 剪花布条

#include<bits/stdc++.h>
#define N 1000025
using namespace std;
int n,m;
char s[N],p[N];
int next2[N];

void getnext()
{
    int i=0,j=-1;
    next2[0]=-1;
    m=strlen(p);
    while(i<m)
    {
        if(j==-1||p[i]==p[j])
        {
            next2[++i]=++j;
        }
        else {
                j=next2[j];
        }
    }

}

int kmp()
{
    int i=0,j=0,sum=0;
    getnext();
    n=strlen(s);
    while(i<n)
    {
        if(j==-1||s[i]==p[j])
        {
            j++;
            i++;
        }
        else j=next2[j];
        if(j==m)
        {
            sum++;
            j=0;//初始0,重新计数
        }
    }
    return sum;
}

int main()
{
    while(1)
    {
        scanf("%s",&s);
        if(s[0]=='#')
            break;
        scanf("%s",&p);
        printf("%d\n",kmp());
    }
    return 0;
}

E - Compress Words

把一串字符串合并,也就是前一个字符串的尾和后一个字符串的头相同的部分,只需要写一个

解析:

扩展kmp是用t串的前缀与s串的每个后缀去匹配

这里输出的串为kk

每次只取kk串的尾部长为t.size()的来匹配

如果遍历t.size(),如果能全匹配,就取最长的,然后割掉能匹配的,把剩下的加到kk里

ac:

#include<bits/stdc++.h>
#define IOS ios::sync_with_stdio(false);cin.tie(0);
#define mod 1000000007
#define ll long long
using namespace std;

ll extend[2000001];
ll Next[2000001];

void getNext(string t)
{
    ll len=t.length();
    Next[0]=len;
    ll a,p;
    a=1;
    while( a<len && t[a]==t[a-1]) a++; // 求出长度为1的时候 解为多少
    Next[1]=a-1;
    a=1;
    for(ll i=2;i<len;i++) // 后续的按照算法来就好
    {
        p=a+Next[a]-1;
        if((i-1)+Next[i-a] < p ) Next[i]=Next[i-a];// 第一种情况 没有超过等于的部分
        else // 超过的话就不好直接用next的定义 需要后续的遍历
        {
            ll j = (p - i + 1) > 0 ? (p - i + 1) : 0;
            while(i + j < len && t[i+j] == t[j]) j++;
            Next[i]=j;
            a=i;
        }
    }
}
void exkmp(string s,string t) // s->extend  t->next
{
    for(int i=0;i<2*t.size();i++)
        extend[i]=Next[i]=0;
    getNext(t);
    ll a,p;//
    ll slen=s.length();
    ll tlen=t.length();
    a=p=0;
    ll len=min(s.length(),t.length());
    while(p<len && t[p]==s[p]) p++; // after
    extend[0]=p;
    for(ll i=1;i<slen;i++)
    {
        p=a+extend[a]-1; // update
        if( (i-1)+Next[i-a] < p) extend[i]=Next[i-a];
        else
        {
            ll j = (p - i + 1) > 0 ? (p - i + 1) : 0;
            while( j < tlen && i+j < slen && s[i + j] == t[j]) j++;
            extend[i]=j;
            a=i;
        }
    }
}

string p[100001],s,t,kk;

int main()
{
    IOS
    int n;
    cin>>n;
    for(int i=1;i<=n;i++)
        cin>>p[i];
    kk=kk+p[1];
    for(int i=2;i<=n;i++)
    {
        int len=kk.length();
        t=p[i];
        int lenb=t.length();
        int st=max(0,len-lenb);
        s=kk.substr(st,min(len,lenb));
        exkmp(s,t);
        int maxs=0;
        for(int i=0;i<lenb;i++)
        {
            if(extend[i]==min(len,lenb)-i)
            {
                maxs=extend[i];
                break;
            }
        }
        kk+=t.substr(maxs,lenb-maxs);
    }
    cout<<kk<<endl;
    return 0;
}

树状数组+kmp:https://nanti.jisuanke.com/t/A1253

 

链接:http://acm.hdu.edu.cn/showproblem.php?pid=6740

题意:

给定一个a,b,给定一个字符串(小数)

a*x-b*y,x为循环个数,y为循环节长度

020,循环节有0,20,02等

解析:

直接将小数点后的字符串反转,然后求next数组,若以i为循环长度,则i-next[i]即为循环节的长度

ac:

#include<bits/stdc++.h>
#define ll long long
#define MAXN 10000005
using namespace std;
char s[MAXN];
char p[MAXN];
ll tot=0,m;
ll fail[MAXN];

void getnext()
{
    ll i=0,j=-1;
    fail[0]=-1;
    while(i<m)
    {
        if(j==-1||p[i]==p[j])
        {
            fail[++i]=++j;
        }
        else {
                j=fail[j];
        }
    }
}

int main()
{
    ll a,b;
    while(scanf("%lld%lld",&a,&b)!=EOF)
    {
        tot=0;
        scanf("%s",s+1);
        ll len=strlen(s+1);
        for(ll i=len;i>=1;i--)
        {
            if(s[i]=='.')
                break;
            else{
                p[tot++]=s[i];
            }
        }
        p[tot++]='\0';//lenb=tot-1
        m=tot-1;
        getnext();
        ll ans=a-b;
        for(int i=2;i<=m;i++)
            ans=max(ans,a*(i)-b*(i-fail[i]));
        printf("%lld\n",ans);
    }
    return 0;
}

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值