回文子串——Manacher马拉车算法

最新推荐文章于 2021-01-29 17:34:44 发布

原创最新推荐文章于 2021-01-29 17:34:44 发布 · 585 阅读

0 ·

CC 4.0 BY-SA版权

洛谷（若BZOJ和洛谷均有的题算BZOJ）专栏收录该内容

20 篇文章

订阅专栏

本文详细介绍马拉车算法，这是一种用于寻找字符串中最长回文子串的高效算法，将时间复杂度优化到线性级别。文中解释了如何通过在字符间插入特殊符号来处理不同长度的回文子串，并给出了具体的实现步骤及示例。

我们有些时候会遇到求最大回文字符串的问题。对于回文字符串，我们首先想到的就是N^2的暴力，对于每一个点都向左或者向右延伸。但这样做显然不是特别优秀。而今天介绍的马拉车算法的最大贡献就是将时间复杂度提升到了线性，这是非常了不起的。

回文字符串有两种，一种长度为奇数，如aba。另一种长度为偶数，如abba。对于奇数，只要询问中间每一个点即可，而偶数不存在中间点，所以我们得创造一个中间点。我们将每两个字符间插入一个字符#。即可完成。例如aba变为#a#b#a#,而abba变为#a#b#b#a#。

可见奇数长度回文子串的中间字符不为’#’，而偶数长度子串的字符为#。

我们定义p[i]，表示从i开始向右走和向左走字符一样的字符长度。这么讲大家可能有点懵，所以我们演示一下。

对于字符串abbababaaab,加完#后就是#a#b#b#a#b#a#b#a#a#a#b#，对于p[11]（也就是第3个a），其值为6，因为我们扩展出的子串为a#b#a#（包括它自己本身）。

那么问题来了，怎么求数组p呢？在求解之前，我们先规定id为最大回文子串中心的位置，mx是回文串能延伸到的最右端的位置。我先把公式搁这儿：

p[i]=mx>i?min(p[id*2-i],mx-i):1;

为什么是这样的呢？我们可以先进行讨论，如果i>mx，也就是i在我们目前已知的回文串之外，那我们就管不了它了，先让它维护它自己（也就是1），到之后再去暴力枚举，更新mx和id。

而如果i< mx，我们又要进行讨论，若i关于id的对应点j的值p[j]< mx-i，说明i的p值也一定小于mx-i,应为对于子串j_id-1和id+1i，它们两两相同。

这里写图片描述

而如果p[j]>mx-i，说名p[i]也可以大于mx-i，所以我们先将p[i]赋值为mx-i，然后再去暴力枚举更新p[i]，并更新mx,id。

这样一直更新就是我们的马拉车算法。那么这个算式也就十分容易理解了。通过平均数定力x=(x1+x2)/2得，2*id-i也就是对应点j，所以其实这个算式的意思是

if(mx>i){
	if(mx-i>p[j]) p[i]=p[j];
	else p[i]=mx-i;
}
else p[i]=1;

传送门：马拉车算法的练习题

这道题是一道简单的马拉车算法题，因为只需要求技术回文子串，所以不需要添加#（我的程序还是加了），我们只需要用前缀和来维护序列的长度。由于若一个子串长度为l，则这个串里一定至少有一个长为l-2,l-4,l-6……的串（只需要去掉头尾，所以一直-2），所以对于长度为l的串的总数tot[l]，只要加上tot[l+2]，即可维护总共的长度为l的串的值。

这题还得写快速幂，因为数据较大，直接for来乘可能会超时

#include<bits/stdc++.h>
#define ll long long
#define md 19930726
using namespace std;
ll n,m,k,p[5000005],mx,id,tot[1000005],ans=1;
string s,t;
ll read(){
    char c;ll x;while(c=getchar(),c<'0'||c>'9');x=c-'0';
    while(c=getchar(),c>='0'&&c<='9') x=x*10+c-'0';return x;
}
void manacher(){
    t="@#";   //在串头随意添加一个字符，如@，防止其一直匹配空串
    for(ll i=0;i<n;i++){
        t.push_back(s[i]);
        t.push_back('#');
    }
    for(ll i=1;i<t.size();i++){
        p[i]=mx>i?min(p[id*2-i],mx-i):1;
        while(t[i+p[i]]==t[i-p[i]]) p[i]++;
        if(mx<i+p[i]){
            mx=i+p[i];id=i;
        }
    }
}
ll pows(ll a,ll b){
    ll base=1;
    while(b){
        if(b&1) base=base*a%md;
        a=a*a%md;
        b/=2;
    }
    return base;
}
int main()
{
    n=read();k=read();
    cin>>s;
    manacher();
    for(ll i=1;i<t.size();i++){
        if(t[i]=='#') continue;
        tot[p[i]-1]++;
    }
    for(int i=n;i>=1;i--)
       if(i%2==1) tot[i]+=tot[i+2];
    for(ll i=n;i>=1;i--){
        if(!tot[i]) continue;
        if(k-tot[i]>=0){
            k-=tot[i];ans=(ans*pows(i,tot[i]))%md;
        }
        else{
            ans=(ans*pows(i,k))%md;break;
        }
    }
    printf("%lld",ans%md);
    return 0;
}