lintcode200 · 最长回文子串(马拉车算法)

本文详细介绍马拉车算法(Manacher's Algorithm),这是一种用于寻找字符串中最长回文子串的有效线性方法。文章解释了如何通过在字符间插入特殊符号来统一处理奇数和偶数长度的回文串,并通过示例介绍了算法的核心思想及其实现步骤。
题目描述

在这里插入图片描述
Manacher’s Algorithm 马拉车算法
马拉车算法 Manacher‘s Algorithm 是用来查找一个字符串的最长回文子串的线性方法,由一个叫Manacher的人在1975年发明的,这个方法的最大贡献是在于将时间复杂度提升到了线性。

首先我们解决下奇数和偶数的问题,在每个字符间插入"#",并且为了使得扩展的过程中,到边界后自动结束,在两端分别插入 “^” 和 “$”,两个不可能在字符串中出现的字符,这样中心扩展的时候,判断两端字符是否相等的时候,如果到了边界就一定会不相等,从而出了循环。经过处理,字符串的长度永远都是奇数了。
在这里插入图片描述
首先我们用一个数组 P 保存从中心扩展的最大个数,而它刚好也是去掉 “#” 的原字符串的总长度。例如下图中下标是 6 的地方。可以看到 P[ 6 ] 等于 5,所以它是从左边扩展 5 个字符,相应的右边也是扩展 5 个字符,也就是 “#c#b#c#b#c#”。而去掉 # 恢复到原来的字符串,变成 “cbcbc”,它的长度刚好也就是 5。
在这里插入图片描述
求原字符串下标
用 P 的下标 i 减去 P [ i ],再除以 2 ,就是原字符串的开头下标了。

例如我们找到 P[ i ] 的最大值为 5 ,也就是回文串的最大长度是 5 ,对应的下标是 6 ,所以原字符串的开头下标是 (6 - 5 )/ 2 = 0 。所以我们只需要返回原字符串的第 0 到 第 (5 - 1)位就可以了。

求每个 P [ i ]
接下来是算法的关键了,它充分利用了回文串的对称性。

我们用 C 表示回文串的中心,用 R 表示回文串的右边半径。所以 R = C + P[ i ] 。C 和 R 所对应的回文串是当前循环中 R 最靠右的回文串。

让我们考虑求 P [ i ] 的时候,如下图。

用 i_mirror 表示当前需要求的第 i 个字符关于 C 对应的下标。
在这里插入图片描述
我们现在要求 P [ i ], 如果是用中心扩展法,那就向两边扩展比对就行了。但是我们其实可以利用回文串 C 的对称性。i 关于 C 的对称点是 i_mirror ,P [ i_mirror ] = 3,所以 P [ i ] 也等于 3 。

但是有三种情况将会造成直接赋值为 P [ i_mirror ] 是不正确的,下边一一讨论。

1. 超出了 R
在这里插入图片描述
当我们要求 P [ i ] 的时候,P [ mirror ] = 7,而此时 P [ i ] 并不等于 7 ,为什么呢,因为我们从 i 开始往后数 7 个,等于 22 ,已经超过了最右的 R ,此时不能利用对称性了,但我们一定可以扩展到 R 的,所以 P [ i ] 至少等于 R - i = 20 - 15 = 5,会不会更大呢,我们只需要比较 T [ R+1 ] 和 T [ R+1 ]关于 i 的对称点就行了,就像中心扩展法一样一个个扩展。

2. P [ i_mirror ] 遇到了原字符串的左边界
在这里插入图片描述
此时P [ i_mirror ] = 1,但是 P [ i ] 赋值成 1 是不正确的,出现这种情况的原因是 P [ i_mirror ] 在扩展的时候首先是 “#” == “#” ,之后遇到了 "^"和另一个字符比较,也就是到了边界,才终止循环的。而 P [ i ] 并没有遇到边界,所以我们可以继续通过中心扩展法一步一步向两边扩展就行了。

3. i 等于了 R
就这样一步一步的求出每个 P [ i ],当求出的 P [ i ] 的右边界大于当前的 R 时,我们就需要更新 C 和 R 为当前的回文串了。因为我们必须保证 i 在 R 里面,所以一旦有更右边的 R 就要更新 R。
在这里插入图片描述
此时的 P [ i ] 求出来将会是 3 ,P [ i ] 对应的右边界将是 10 + 3 = 13,所以大于当前的 R ,我们需要把 C 更新成 i 的值,也就是 10 ,R 更新成 13。继续下边的循环。

java代码实现
    public String longestPalindrome(String s) {
        if ((s == null) || (s.length() == 0))
            return "";
        int n = s.length();
        char[] ch = new char[2 * n + 3];
        Arrays.fill(ch, '#');
        ch[0] = '^';
        ch[2 * n + 2] = '$';
        for (int i = 1; i <= n; i++) {
            ch[2 * i] = s.charAt(i - 1);
        }
        int[] P = new int[2 * n + 3];
        int C = 0, R = 0;
        int i_mirror;
        for (int i = 1; i < 2 * n + 2; i++) {
            i_mirror = 2 * C - i;
            if (i < R)
                P[i] = Math.min(P[i_mirror], R - i);
            else
                P[i] = 0;
            while (ch[i + P[i] + 1] == ch[i - P[i] - 1])
                P[i]++;
            if (i + P[i] > R) {
                R = i + P[i];
                C = i;
            }
        }
        int len = Arrays.stream(P).max().getAsInt();
        int start = (IntStream.range(0, P.length).reduce((i, j) -> P[i] > P[j] ? i : j).getAsInt() - len) / 2;
        return s.substring(start, start + len);
    }
<think>好的,我现在需要帮助用户理解马拉算法(Manacher's Algorithm)的实现方法和原理,以及如何用它优化最长回文子串检测。用户之前已经了解过中心扩展法,现在想升级到更高效的算法。我需要参考提供的引用内容,特别是引用1、3和4中的信息,来构建一个清晰的解释。 首先,我得回忆马拉算法的核心思想。根据引用3,马拉算法通过预处理字符串和处理奇偶回文的情况,将时间复杂度降到了线性O(n)。引用4中的代码示例展示了如何插入分隔符(如#号)来统一处理奇偶长度的回文,这是关键的一步。同时,算法利用回文半径和对称性来避免重复计算,这应该和动态规划或中心扩展法中的某些优化有关。 接下来,我需要拆解算法的步骤。预处理部分,插入特殊字符将字符串转换为奇数长度,这样可以统一处理奇偶情况。例如,字符串"abba"变成"#a#b#b#a#",每个字符周围都有#,这样无论原回文是奇数还是偶数长度,转换后都变成奇数长度,方便处理。 然后,维护几个关键变量:当前最大右边界R,对应的中心C,以及每个位置的回文半径数组P。当遍历每个字符时,利用对称性(mirror)来确定初始回文半径,这样可以减少不必要的扩展次数。例如,如果当前字符i在R的左侧,可以利用其关于C的对称点mirror的P值来初始化P[i],避免从零开始扩展。 在代码实现部分,需要处理不同的case,比如i在R内或外的情况,然后进行中心扩展。引用4中的Java代码展示了如何处理这些情况,包括更新C和R的位置,以及记录最大回文长度和对应的中心点。我需要将这段代码转换为C++,并确保正确性,比如处理字符串预处理和回文半径的计算。 此外,用户可能对算法的时间复杂度分析感兴趣。马拉算法的时间复杂度是O(n),因为每个字符的扩展操作总体上是线性的,每个字符最多被扩展一次。这需要详细解释,确保用户明白为什么这个算法比中心扩展法更高效。 同时,用户的问题提到了优化方法和代码示例,所以需要将理论解释与代码结合,逐步说明每个部分的作用。比如,预处理字符串的部分,如何构造新的字符串,然后初始化P数组,遍历每个字符,利用对称性确定初始半径,然后进行扩展,更新最大边界和中心。 可能还需要对比其他方法,如动态规划和中心扩展,突出马拉算法的优势,如线性时间和较低的空间复杂度(O(n))。引用2中提到的动态规划空间复杂度较高,而马拉算法在空间上只需要一个数组,因此更优。 测试用例也是重要的,需要提供几个示例来验证代码的正确性,比如"babad"应该返回"bab"或"aba",而"cbbd"应该返回"bb"。这有助于用户理解代码的实际效果。 最后,确保回答结构清晰,分步骤讲解,原理与实现并重,引用相关的参考文献,并在末尾添加相关问题,引导用户深入思考。比如,如何修改代码以返回最长回文子串本身,或者如何处理特殊字符的情况等。</think>### 马拉算法(Manacher's Algorithm)详解 --- #### 一、算法核心原理 马拉算法通过**预处理字符串**和**利用回文对称性**,将时间复杂度优化到$O(n)$。其核心优化点包括: 1. **预处理插入分隔符**:将任意字符串转换为**奇数长度**,统一处理奇偶回文 - 例如:`"abba" → "#a#b#b#a#"` 2. **维护回文半径数组**:记录每个位置的最长回文半径$P[i]$ 3. **动态右边界维护**:通过当前最大右边界$R$和中心点$C$减少重复计算[^3] --- #### 二、算法步骤分解 ##### 步骤1:字符串预处理 ```cpp string preprocess(const string& s) { string t = "^#"; for (char c : s) { t += c; t += '#'; } t += "$"; // 避免边界判断 return t; } ``` *作用*:原字符串`"abc"`转换为`^#a#b#c#$`,所有回文子串长度变为奇数[^4] --- ##### 步骤2:核心算法实现 ```cpp string manacher(const string& s) { if (s.empty()) return ""; string t = preprocess(s); int n = t.size(); vector<int> P(n, 0); // 回文半径数组 int C = 0, R = 0; // 当前最大回文中心及右边界 int max_len = 0; // 最大回文长度 int center = 0; // 最长回文的中心 for (int i = 1; i < n-1; ++i) { int mirror = 2 * C - i; // 计算i的对称点 // 关键优化:利用对称性初始化P[i] if (i < R) { P[i] = min(R - i, P[mirror]); } // 中心扩展 while (t[i + P[i] + 1] == t[i - P[i] - 1]) { P[i]++; } // 更新右边界和中心 if (i + P[i] > R) { C = i; R = i + P[i]; } // 记录最大值 if (P[i] > max_len) { max_len = P[i]; center = i; } } // 计算结果在原字符串中的位置 int start = (center - max_len) / 2; return s.substr(start, max_len); } ``` --- #### 三、关键优化技术解析 | 技术 | 实现方式 | 优化效果 | |------|----------|----------| | 对称性利用 | 通过镜像点`mirror`获取初始半径 | 避免重复计算 | | 动态边界维护 | 实时更新$C$和$R$ | 限制扩展次数 | | 预处理统一处理 | 插入分隔符`#` | 消除奇偶差异 | --- #### 四、时间复杂度分析 - **预处理阶段**:$O(n)$ - **主循环阶段**:每个字符最多被扩展一次,总扩展次数不超过$n$次 → **整体$O(n)$**[^3] --- #### 五、测试用例验证 ```cpp int main() { cout << manacher("babad") << endl; // 输出 "bab" 或 "aba" cout << manacher("cbbd") << endl; // 输出 "bb" cout << manacher("a") << endl; // 输出 "a" return 0; } ``` --- #### 六、与其他算法对比 | 算法 | 时间复杂度 | 空间复杂度 | 适用场景 | |------|------------|------------|----------| | 暴力法 | $O(n^3)$ | $O(1)$ | 教学演示 | | 中心扩展 | $O(n^2)$ | $O(1)$ | 常规应用 | | 动态规划 | $O(n^2)$ | $O(n^2)$ | 子问题分析 | | **马拉算法** | $O(n)$ | $O(n)$ | 大规模数据处理[^2] | --- ### 七、算法特性总结 1. **线性时间复杂度**:适用于处理百万级长度的字符串 2. **空间效率高**:仅需一个长度$n$的辅助数组 3. **边界处理技巧**:通过添加`^`和`$`符号避免特殊判断[^4] --- ### 相关问题 1. 如何处理字符串中的特殊字符(如`#`本身)? 2. 如何修改算法同时返回所有最长回文子串? 3. 为什么预处理时选择`#`作为分隔符? 4. 如何证明该算法的时间复杂度是严格的$O(n)$?[^3]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值