判断最长回文子串_codestorm_新浪博客

本文详细介绍了一个O(N)时间复杂度的Manacher算法,用于寻找字符串中的最长回文子串。通过对字符串进行预处理并利用回文的对称性质,该算法能够有效地避免重复计算。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

转自: http://www.cnblogs.com/bitzhuwei/p/Longest-Palindromic-Substring-Part-II.html

[译+改]最长回文子串(Longest Palindromic Substring) Part II

原文链接在http://leetcode.com/2011/11/longest-palindromic-substring-part-ii.html

原文作者有些地方逻辑上有点小问题,我做了纠正。关于解释时间复杂度上,原作者就只有两句话,我无法理解,特意在此加强了,便于理解。

问题:给定字符串S,求S中的最长回文子串。

在上一篇,我们给出了4种算法,其中包括一个O(N2)时间O(1)空间的算法(中心检测法),已经很不错了。本篇将讨论一个O(N)时间O(N)空间的算法,即著名的Manacher算法,并详细说明其时间复杂度为何是O(N)。

提示

先想想有什么办法能改进中心检测法。

考虑一下最坏的情况。★

最坏的情况就是各个回文相互重叠的时候。例如"aaaaaaaaaa"和" cabcbabcbabcba"。

为什么说有重叠时是最坏的情况?因为会发生重复计算。★(换句话说,没有重叠时,必须要一点一点计算,也就没有可改进的余地了。)

花费一些空间来避免重复计算。★

利用回文的特性避免重复计算。★

一个O(N)的算法(Manacher)

首先我们把字符串S改造一下变成T,改造方法是:在S的每个字符之间和S首尾都插入一个"#"。这样做的理由你很快就会知道。

例如,S="abaaba",那么T="#a#b#a#a#b#a#"。

 

想一下,你必须在以Ti为中心左右扩展才能确定以Ti为中心的回文长度d到底是多少。(就是说这一步是无法避免的)

为了改进最坏的情况,我们把各个Ti处的回文半径存储到数组P,用P[i]表示以Ti为中心的回文长度。那么当我们求出所有的P[i],取其中最大值就能找到最长回文子串了。

对于上文的示例,我们先直接写出所有的P研究一下。

i = 0 1 2 3 4 5 6 7 8 9 A B C

T = # a # b # a # a # b # a #

P = 0 1 0 3 0 1 6 1 0 3 0 1 0

显然最长子串就是以P[6]为中心的"abaaba"。

你是否发现了,在插入"#"后,长度为奇数和偶数的回文都可以优雅地处理了?这就是其用处。

现在,想象你在"abaaba"中心画一道竖线,你是否注意到数组P围绕此竖线是中心对称的?再试试"aba"的中心,P围绕此中心也是对称的。这当然不是巧合,而是在某个条件下的必然规律。我们将利用此规律减少对数组P中某些元素的重复计算。

 

我们来看一个重叠得更典型的例子,即S="babcbabcbaccba"。

 

上图展示了把S转换为T的样子。假设你已经算出了一部分P。竖实线表示回文"abcbabcba"的中心C,两个虚实线表示其左右边界L和R。你下一步要计算P[i],i围绕C的对称点是i’。你有办法高效地计算P[i]吗?

 

我们先看一下i围绕C的对称点i’(此时i’=9)。

 

据上图所示,很明显P[i]=P[i’]=1。这是因为i和i’围绕C对称。同理,P[12]=P[10]=0,P[14]=P[8]=0。

 

现在再看i=15处。此时P[15]=P[7]=7?错了,你逐个字符检测一下会发现此时P[15]应该是5。

为什么此时规则变了?

 

如上图所示,两条绿色实线划定的范围必定是对称的,两条绿色虚线划定的范围必定也是对称的。此时请注意P[i’]=7,超过了左边界L。超出的部分就不对称了。此时我们只知道P[i]>=5,至于P[i]还能否扩展,只有通过逐个字符检测才能判定了。

在此例中,P[21]≠P[9],所以P[i]=P[15]=5。

 

我们总结一下上述分析过程,就是这个算法的关键部分了。

if P[ i' ] < R – i,

then P[ i ] ← P[ i' ]

else P[ i ] ≥ R - i. (此时要穿过R逐个字符判定P[i]).

(注:原作者的写法在逻辑上欠妥,我作了修正)

 

是不是很优雅?如果你能理解到这里,你已经搞定了这个算法最困难也最精华的部分了。

 

很明显C的位置也是需要移动的,这个很容易:

如果i处的回文超过了R,那么就C=i,同时相应改变L和R即可。

 

每次求P[i],都有两种可能。如果P[i‘] < R – i,我们就P[i] = P[i’]。否则,就从R开始逐个字符求P[i],并更新C及其R。此时扩展R(逐个字符求P[i])最多用N步,而求每个C也总共需要N步。所以时间复杂度是2*N,即O(N)。

(注:原作者计算时间复杂度的这句话我没看懂。我自己想办法理解了,详情见下图。

图中i为索引,T为加入"#"、"^"和"$"后的字符串,P[i]就是算法里的p[i],calc[i]是为了求出P[i]而需要执行比较的次数。

"V"表示此列的字符与其左侧的字符进行了比较,在左侧用"X"对应。绿色的表示比较结果为两个字符相同(即比较结果为成功),红色的表示不同(即比较结果为失败)。

很显然"X"和"V"的数量是相等的。

你可以看到,所需的成功比较的次数(绿色的"V",表现为横向增长)不超过N,失败的次数(红色的"V",表现为纵向增长)也不超过N,所以这个算法的时间复杂度就是2N,即O(N)。

原作者的程序不便于理解,我贴上我的代码。

 1 public class Solution {
 2     // Transform S into T.
 3     // For example, S = "abba", T = "^#a#b#b#a#$".
 4     // ^ and $ signs are sentinels appended to each end to avoid bounds checking
 5     String preProcess(String s) {
 6         int n = s.length();
 7         if (n == 0) return "^$";
 8 
 9         String ret = "^";
10         for (int i = 0; i < n; i++)
11         {
12             ret += "#" + s.substring(i, i + 1);
13         }
14         
15         ret += "#$";
16         return ret;
17     }
18     public String longestPalindrome(String s) {
19         String T = preProcess(s);
20         int length = T.length();
21         int[] p = new int[length];
22         int C = 0, R = 0;
23         
24         for (int i = 1; i < length - 1; i++)
25         {
26             int i_mirror = C - (i - C);
27             int diff = R - i;
28             if (diff >= 0)//当前i在C和R之间,可以利用回文的对称属性
29             {
30                 if (p[i_mirror] < diff)//i的对称点的回文长度在C的大回文范围内部
31                 { p[i] = p[i_mirror]; }
32                 else
33                 {
34                     p[i] = diff;
35                     //i处的回文可能超出C的大回文范围了
36                     while (T.charAt(i + p[i] + 1) == T.charAt(i - p[i] - 1))
37                     { p[i]++; }
38                     C = i;
39                     R = i + p[i];
40                 }
41             }
42             else
43             {
44                 p[i] = 0;
45                 while (T.charAt(i + p[i] + 1) == T.charAt(i - p[i] - 1))
46                 { p[i]++; }
47                 C = i;
48                 R = i + p[i];
49             }
50         }
51 
52         int maxLen = 0;
53         int centerIndex = 0;
54         for (int i = 1; i < length - 1; i++) {
55             if (p[i] > maxLen) {
56               maxLen = p[i];
57               centerIndex = i;
58             }
59         }
60         return s.substring((centerIndex - 1 - maxLen) / 2, (centerIndex - 1 - maxLen) / 2 + maxLen);        
61     }
62 }

 

注意

这个算法是non-trivial的,没人会在面试时要求你给出这么霸气的东西。不过,如果你能读到这里并理解到这里,值得给自己一个大大的奖励了!


<think>嗯,用户现在想了解如何在Java判断最长回文子串。首先,我得确定用户对这个问题的理解程度。可能用户已经知道回文子串的基本概念,但需要具体的实现方法。用户可能是在准备面试,或者在学习算法,或者是实际开发中遇到了相关问题。 接下来,我需要考虑不同的解决方法。最长回文子串的常见解法有暴力法、动态规划和中心扩展法。暴力法的时间复杂度太高,可能不太实用,但可以作为基础理解。动态规划可以优化时间复杂度,但空间复杂度可能较高。中心扩展法则在时间和空间上都比较高效,适合作为主要解法。 然后,用户可能更关注代码的实现细节和效率。我需要解释每种方法的思路,并给出具体的Java代码示例。同时,要注意代码的可读性,比如变量命名和结构,确保用户能理解。 用户可能还会想知道不同方法的时间复杂度,比如暴力法是O(n³),动态规划是O(n²),中心扩展法也是O(n²),但实际中中心扩展法更快,因为常数因子更小。需要强调这一点,帮助用户选择合适的方案。 另外,用户可能对特殊测试用例有疑问,比如字符串长度为1,或者全部字符相同的情况。在代码示例中,应该处理这些边界情况,比如在中心扩展法中,当左右字符相同时继续扩展,确保覆盖所有可能的回文。 还要考虑用户可能的误区,例如在动态规划中如何初始化状态表,或者在中心扩展时如何处理偶数和奇数长度的回文。需要详细解释这些细节,避免用户在实际编码时出错。 最后,总结部分应该比较不同方法的优缺点,帮助用户根据实际需求选择最合适的解法。同时,提醒用户注意代码的健壮性,比如处理空字符串或null值的情况,虽然示例中可能省略了这些,但在实际应用中需要考虑。</think>### **Java实现最长回文子串详解** 判断最长回文子串是经典的字符串处理问题。下面通过**暴力法、动态规划、中心扩展法**三种方法解析实现原理,并给出优化代码与时间复杂度对比。 --- #### **一、问题定义** **回文子串**:正读和反读相同的字符串片段 **目标**:在给定字符串`s`中找出**长度最长**的回文子串 **示例**: - 输入:`"babad"` → 输出:`"bab"`或`"aba"` - 输入:`"cbbd"` → 输出:`"bb"` --- #### **二、暴力法(Brute Force)** ##### **思路** 1. 遍历所有可能的子串(双重循环枚举起止点) 2. 检查每个子串是否为回文 3. 记录最长回文子串 ##### **代码实现** ```java public String longestPalindrome(String s) { if (s == null || s.length() < 1) return ""; int maxLen = 0; String res = ""; for (int i = 0; i < s.length(); i++) { for (int j = i; j < s.length(); j++) { String sub = s.substring(i, j + 1); if (isPalindrome(sub) && sub.length() > maxLen) { maxLen = sub.length(); res = sub; } } } return res; } // 辅助方法:检查回文 private boolean isPalindrome(String s) { int left = 0, right = s.length() - 1; while (left < right) { if (s.charAt(left++) != s.charAt(right--)) { return false; } } return true; } ``` ##### **复杂度分析** - 时间复杂度:$O(n^3)$(两层循环$O(n^2)$ × 回文检查$O(n)$) - 空间复杂度:$O(1)$ **适用场景**:仅适用于极短字符串(长度 ≤ 50) --- #### **三、动态规划(DP)** ##### **核心思路** - 定义状态:`dp[i][j]`表示子串`s[i...j]`是否为回文 - 状态转移方程: - 若`s[i] == s[j]`且`dp[i+1][j-1] == true` → `dp[i][j] = true` - 边界条件:当子串长度为1或2时直接判断 ##### **代码实现** ```java public String longestPalindrome(String s) { int n = s.length(); if (n < 2) return s; boolean[][] dp = new boolean[n][n]; int maxLen = 1, start = 0; // 初始化:所有长度为1的子串都是回文 for (int i = 0; i < n; i++) { dp[i][i] = true; } // 枚举子串长度 for (int len = 2; len <= n; len++) { for (int i = 0; i <= n - len; i++) { int j = i + len - 1; // 子串结束位置 if (s.charAt(i) != s.charAt(j)) { dp[i][j] = false; } else { if (len == 2) { dp[i][j] = true; } else { dp[i][j] = dp[i + 1][j - 1]; } } // 更新最长回文 if (dp[i][j] && len > maxLen) { maxLen = len; start = i; } } } return s.substring(start, start + maxLen); } ``` ##### **复杂度分析** - 时间复杂度:$O(n^2)$ - 空间复杂度:$O(n^2)$(二维DP表) **适用场景**:需要多次查询子串回文性的场景 --- #### **四、中心扩展法(最优解)** ##### **核心思路** - 每个回文的中心可能是一个字符(奇长度)或两个字符(偶长度) - 从每个可能的中心向两侧扩展,寻找最长回文 ##### **代码实现** ```java public String longestPalindrome(String s) { if (s == null || s.length() < 1) return ""; int start = 0, end = 0; for (int i = 0; i < s.length(); i++) { // 处理奇数长度回文(中心为单个字符) int len1 = expandAroundCenter(s, i, i); // 处理偶数长度回文(中心为两个相同字符) int len2 = expandAroundCenter(s, i, i + 1); int maxLen = Math.max(len1, len2); if (maxLen > end - start) { start = i - (maxLen - 1) / 2; end = i + maxLen / 2; } } return s.substring(start, end + 1); } // 从中心向两侧扩展 private int expandAroundCenter(String s, int left, int right) { while (left >= 0 && right < s.length() && s.charAt(left) == s.charAt(right)) { left--; right++; } return right - left - 1; // 实际回文长度 = (right-1) - (left+1) + 1 } ``` ##### **复杂度分析** - 时间复杂度:$O(n^2)$(每个字符作为中心扩展两次) - 空间复杂度:$O(1)$ **实际效率**:比动态规划快约2倍(避免了二维数组操作) --- #### **五、三种方法对比** | 方法 | 时间复杂度 | 空间复杂度 | 优势 | 局限性 | |--------------|------------|------------|--------------------------|--------------------------| | **暴力法** | $O(n^3)$ | $O(1)$ | 实现简单 | 无法处理长度 >100 的输入 | | **动态规划** | $O(n^2)$ | $O(n^2)$ | 可复用中间结果 | 空间占用高 | | **中心扩展** | $O(n^2)$ | $O(1)$ | 空间最优,实际运行最快 | 无 | --- #### **六、边界条件与测试用例** 1. **空字符串** ```java Input: "" → Output: "" ``` 2. **全相同字符** ```java Input: "aaaaa" → Output: "aaaaa" ``` 3. **最长回文在末尾** ```java Input: "abcbcbd" → Output: "bcbcb" ``` --- ### **总结** - **推荐方案**:优先选择**中心扩展法**,兼顾时间与空间效率 - **扩展思考**:Manacher算法可将时间复杂度优化到$O(n)$,但实现较复杂,适用于超长字符串(如长度 ≥ $10^6$)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值