回文子串——Manacher马拉车算法

本文详细介绍马拉车算法,这是一种用于寻找字符串中最长回文子串的高效算法,将时间复杂度优化到线性级别。文中解释了如何通过在字符间插入特殊符号来处理不同长度的回文子串,并给出了具体的实现步骤及示例。
我们有些时候会遇到求最大回文字符串的问题。对于回文字符串,我们首先想到的就是N^2的暴力,对于每一个点都向左或者向右延伸。但这样做显然不是特别优秀。而今天介绍的马拉车算法的最大贡献就是将时间复杂度提升到了线性,这是非常了不起的。
回文字符串有两种,一种长度为奇数,如aba。另一种长度为偶数,如abba。对于奇数,只要询问中间每一个点即可,而偶数不存在中间点,所以我们得创造一个中间点。我们将每两个字符间插入一个字符#。即可完成。例如aba变为#a#b#a#,而abba变为#a#b#b#a#。
可见奇数长度回文子串的中间字符不为’#’,而偶数长度子串的字符为#。
我们定义p[i],表示从i开始向右走和向左走字符一样的字符长度。这么讲大家可能有点懵,所以我们演示一下。
对于字符串abbababaaab,加完#后就是#a#b#b#a#b#a#b#a#a#a#b#, 对于p[11](也就是第3个a),其值为6,因为我们扩展出的子串为a#b#a#(包括它自己本身)。
那么问题来了,怎么求数组p呢?在求解之前,我们先规定id为最大回文子串中心的位置,mx是回文串能延伸到的最右端的位置。我先把公式搁这儿:
p[i]=mx>i?min(p[id*2-i],mx-i):1;
为什么是这样的呢?我们可以先进行讨论,如果i>mx,也就是i在我们目前已知的回文串之外,那我们就管不了它了,先让它维护它自己(也就是1),到之后再去暴力枚举,更新mx和id。
而如果i< mx,我们又要进行讨论,若i关于id的对应点j的值p[j]< mx-i,说明i的p值也一定小于mx-i,应为对于子串jid-1和id+1i,它们两两相同。

这里写图片描述

而如果p[j]>mx-i,说名p[i]也可以大于mx-i,所以我们先将p[i]赋值为mx-i,然后再去暴力枚举更新p[i],并更新mx,id。
这样一直更新就是我们的马拉车算法。那么这个算式也就十分容易理解了。通过平均数定力x=(x1+x2)/2得,2*id-i也就是对应点j,所以其实这个算式的意思是
if(mx>i){
	if(mx-i>p[j]) p[i]=p[j];
	else p[i]=mx-i;
}
else p[i]=1;

传送门:马拉车算法的练习题

这道题是一道简单的马拉车算法题,因为只需要求技术回文子串,所以不需要添加#(我的程序还是加了),我们只需要用前缀和来维护序列的长度。由于若一个子串长度为l,则这个串里一定至少有一个长为l-2,l-4,l-6……的串(只需要去掉头尾,所以一直-2),所以对于长度为l的串的总数tot[l],只要加上tot[l+2],即可维护总共的长度为l的串的值。
这题还得写快速幂,因为数据较大,直接for来乘可能会超时
#include<bits/stdc++.h>
#define ll long long
#define md 19930726
using namespace std;
ll n,m,k,p[5000005],mx,id,tot[1000005],ans=1;
string s,t;
ll read(){
    char c;ll x;while(c=getchar(),c<'0'||c>'9');x=c-'0';
    while(c=getchar(),c>='0'&&c<='9') x=x*10+c-'0';return x;
}
void manacher(){
    t="@#";   //在串头随意添加一个字符,如@,防止其一直匹配空串
    for(ll i=0;i<n;i++){
        t.push_back(s[i]);
        t.push_back('#');
    }
    for(ll i=1;i<t.size();i++){
        p[i]=mx>i?min(p[id*2-i],mx-i):1;
        while(t[i+p[i]]==t[i-p[i]]) p[i]++;
        if(mx<i+p[i]){
            mx=i+p[i];id=i;
        }
    }
}
ll pows(ll a,ll b){
    ll base=1;
    while(b){
        if(b&1) base=base*a%md;
        a=a*a%md;
        b/=2;
    }
    return base;
}
int main()
{
    n=read();k=read();
    cin>>s;
    manacher();
    for(ll i=1;i<t.size();i++){
        if(t[i]=='#') continue;
        tot[p[i]-1]++;
    }
    for(int i=n;i>=1;i--)
       if(i%2==1) tot[i]+=tot[i+2];
    for(ll i=n;i>=1;i--){
        if(!tot[i]) continue;
        if(k-tot[i]>=0){
            k-=tot[i];ans=(ans*pows(i,tot[i]))%md;
        }
        else{
            ans=(ans*pows(i,k))%md;break;
        }
    }
    printf("%lld",ans%md);
    return 0;
}
<think>好的,我现在需要帮助用户理解马拉算法Manacher's Algorithm)的实现方法和原理,以及如何用它优化最长回文子串检测。用户之前已经了解过中心扩展法,现在想升级到更高效的算法。我需要参考提供的引用内容,特别是引用1、3和4中的信息,来构建一个清晰的解释。 首先,我得回忆马拉算法的核心思想。根据引用3,马拉算法通过预处理字符串和处理奇偶回文的情况,将时间复杂度降到了线性O(n)。引用4中的代码示例展示了如何插入分隔符(如#号)来统一处理奇偶长度的回文,这是关键的一步。同时,算法利用回文半径和对称性来避免重复计算,这应该和动态规划或中心扩展法中的某些优化有关。 接下来,我需要拆解算法的步骤。预处理部分,插入特殊字符将字符串转换为奇数长度,这样可以统一处理奇偶情况。例如,字符串"abba"变成"#a#b#b#a#",每个字符周围都有#,这样无论原回文是奇数还是偶数长度,转换后都变成奇数长度,方便处理。 然后,维护几个关键变量:当前最大右边界R,对应的中心C,以及每个位置的回文半径数组P。当遍历每个字符时,利用对称性(mirror)来确定初始回文半径,这样可以减少不必要的扩展次数。例如,如果当前字符i在R的左侧,可以利用其关于C的对称点mirror的P值来初始化P[i],避免从零开始扩展。 在代码实现部分,需要处理不同的case,比如i在R内或外的情况,然后进行中心扩展。引用4中的Java代码展示了如何处理这些情况,包括更新C和R的位置,以及记录最大回文长度和对应的中心点。我需要将这段代码转换为C++,并确保正确性,比如处理字符串预处理和回文半径的计算。 此外,用户可能对算法的时间复杂度分析感兴趣。马拉算法的时间复杂度是O(n),因为每个字符的扩展操作总体上是线性的,每个字符最多被扩展一次。这需要详细解释,确保用户明白为什么这个算法比中心扩展法更高效。 同时,用户的问题提到了优化方法和代码示例,所以需要将理论解释与代码结合,逐步说明每个部分的作用。比如,预处理字符串的部分,如何构造新的字符串,然后初始化P数组,遍历每个字符,利用对称性确定初始半径,然后进行扩展,更新最大边界和中心。 可能还需要对比其他方法,如动态规划和中心扩展,突出马拉算法的优势,如线性时间和较低的空间复杂度(O(n))。引用2中提到的动态规划空间复杂度较高,而马拉算法在空间上只需要一个数组,因此更优。 测试用例也是重要的,需要提供几个示例来验证代码的正确性,比如"babad"应该返回"bab"或"aba",而"cbbd"应该返回"bb"。这有助于用户理解代码的实际效果。 最后,确保回答结构清晰,分步骤讲解,原理与实现并重,引用相关的参考文献,并在末尾添加相关问题,引导用户深入思考。比如,如何修改代码以返回最长回文子串本身,或者如何处理特殊字符的情况等。</think>### 马拉算法Manacher's Algorithm)详解 --- #### 一、算法核心原理 马拉算法通过**预处理字符串**和**利用回文对称性**,将时间复杂度优化到$O(n)$。其核心优化点包括: 1. **预处理插入分隔符**:将任意字符串转换为**奇数长度**,统一处理奇偶回文 - 例如:`"abba" → "#a#b#b#a#"` 2. **维护回文半径数组**:记录每个位置的最长回文半径$P[i]$ 3. **动态右边界维护**:通过当前最大右边界$R$和中心点$C$减少重复计算[^3] --- #### 二、算法步骤分解 ##### 步骤1:字符串预处理 ```cpp string preprocess(const string& s) { string t = "^#"; for (char c : s) { t += c; t += '#'; } t += "$"; // 避免边界判断 return t; } ``` *作用*:原字符串`"abc"`转换为`^#a#b#c#$`,所有回文子串长度变为奇数[^4] --- ##### 步骤2:核心算法实现 ```cpp string manacher(const string& s) { if (s.empty()) return ""; string t = preprocess(s); int n = t.size(); vector<int> P(n, 0); // 回文半径数组 int C = 0, R = 0; // 当前最大回文中心及右边界 int max_len = 0; // 最大回文长度 int center = 0; // 最长回文的中心 for (int i = 1; i < n-1; ++i) { int mirror = 2 * C - i; // 计算i的对称点 // 关键优化:利用对称性初始化P[i] if (i < R) { P[i] = min(R - i, P[mirror]); } // 中心扩展 while (t[i + P[i] + 1] == t[i - P[i] - 1]) { P[i]++; } // 更新右边界和中心 if (i + P[i] > R) { C = i; R = i + P[i]; } // 记录最大值 if (P[i] > max_len) { max_len = P[i]; center = i; } } // 计算结果在原字符串中的位置 int start = (center - max_len) / 2; return s.substr(start, max_len); } ``` --- #### 三、关键优化技术解析 | 技术 | 实现方式 | 优化效果 | |------|----------|----------| | 对称性利用 | 通过镜像点`mirror`获取初始半径 | 避免重复计算 | | 动态边界维护 | 实时更新$C$和$R$ | 限制扩展次数 | | 预处理统一处理 | 插入分隔符`#` | 消除奇偶差异 | --- #### 四、时间复杂度分析 - **预处理阶段**:$O(n)$ - **主循环阶段**:每个字符最多被扩展一次,总扩展次数不超过$n$次 → **整体$O(n)$**[^3] --- #### 五、测试用例验证 ```cpp int main() { cout << manacher("babad") << endl; // 输出 "bab" 或 "aba" cout << manacher("cbbd") << endl; // 输出 "bb" cout << manacher("a") << endl; // 输出 "a" return 0; } ``` --- #### 六、与其他算法对比 | 算法 | 时间复杂度 | 空间复杂度 | 适用场景 | |------|------------|------------|----------| | 暴力法 | $O(n^3)$ | $O(1)$ | 教学演示 | | 中心扩展 | $O(n^2)$ | $O(1)$ | 常规应用 | | 动态规划 | $O(n^2)$ | $O(n^2)$ | 子问题分析 | | **马拉算法** | $O(n)$ | $O(n)$ | 大规模数据处理[^2] | --- ### 七、算法特性总结 1. **线性时间复杂度**:适用于处理百万级长度的字符串 2. **空间效率高**:仅需一个长度$n$的辅助数组 3. **边界处理技巧**:通过添加`^`和`$`符号避免特殊判断[^4] --- ### 相关问题 1. 如何处理字符串中的特殊字符(如`#`本身)? 2. 如何修改算法同时返回所有最长回文子串? 3. 为什么预处理时选择`#`作为分隔符? 4. 如何证明该算法的时间复杂度是严格的$O(n)$?[^3]
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值