Manacher-求最长回文字符串

本文介绍了一种求解最长回文子串的高效算法,通过预处理原字符串并在其间插入特殊字符来统一处理奇偶长度的回文串,最终实现O(n)时间复杂度内的求解。


转载自:http://blog.sina.com.cn/s/blog_4a08aae90100ridt.html


题目描述:

     回文串就是一个正读和反读都一样的字符串,比如“level”或者“noon”等等就是回文串。       回文子串,顾名思义,即字符串中满足回文性质的子串。        给出一个只由小写英文字符a,b,c...x,y,z组成的字符串,请输出其中最长的回文子串的长度。

 

输入:     输入包含多个测试用例,每组测试用例输入一行由小写英文字符a,b,c...x,y,z组成的字符串,字符串的长度不大于200000。

 

输出:     对于每组测试用例,输出一个整数,表示该组测试用例的字符串中所包含的的最长回文子串的长度。

 

样例输入:
abab
bbbb
abba
样例输出:
3
4
4

思路:

 

      回文串包括奇数长的和偶数长的,一般求的时候都要分情况讨论,这个算法做了个简单的处理把奇偶情况统一了。原来是奇数长度还是奇数长度,偶数长度还是偶数长度。

      算法的基本思路是这样的,把原串每个字符中间用一个串中没出现过的字符分隔#开来(统一奇偶),同时为了防止越界,在字符串的首部也加入一个特殊符$,但是与分隔符不同。同时字符串的末尾也加入'\0'.

      算法的核心:用辅助数组p记录以每个字符为核心的最长回文字符串半径也就是p[i]记录了以str[i]为中心的最长回文字符串半径。p[i]最小为1,此时回文字符串就是字符串本身

      先看个例子:

      原串:        w aa bwsw f d
      新串:     $ # w# a # a # b# w # s # w # f # d #
辅助数组P:    1  2 1 2 3 2 1 2 1 2 1 4 1 2 1 2 1 2 1

 

#include <stdio.h>  
#include <iostream>
using namespace std;

char s[200002];  
char str[400010];  
int p[400010];  

int min(int a,int b){  
	return a < b ? a : b;  
}  

int pre(){  
	int i,j = 0;  
	str[j++] = '$';//加入字符串首部的字符串  
	for(i = 0;s[i];i++){  
		str[j++] = '#';  //分隔符
		str[j++] = s[i];  
	}  
	str[j++] = '#';  
	str[j] = '\0';  //尾部加'\0'
	cout<<str<<endl;
	return j;  
}  

void manacher(int n){  
	int mx = 0,id,i;  
	p[0] = 0;  
	for(i = 1;i < n;i++){  
		if(mx > i)  //在这个之类可以借助前面算的一部分
			p[i] = min(mx - i,p[2 * id - i]); //p[2*id-1]表示j处的回文长度 
		else  //如果i大于mx,则必须重新自己算
			p[i] = 1;  
		while(str[i - p[i]] == str[i + p[i]])  //算出回文字符串的半径
			p[i]++;  
		if(p[i] + i > mx){  //记录目前回文字符串扩展最长的id
			mx = p[i] + i;  
			id = i;  
		}  
	}  
}  


int main(int argc, char const *argv[]){  

	while(scanf("%s",s) != EOF){  
		int n = pre();  
		manacher(n);  
		int ans = 0,i;  
		for(i = 1;i < n;i++)  
			if(p[i] > ans)  
				ans = p[i];  
		printf("%d\n",ans - 1);       
	}  
	return 0;  
} 


     上面的程序说明:pre()函数对给定字符串进行预处理,也就是加分隔符。

 

     上面几个变量说明:id记录具有遍历过程中最长半径的回文字符串中心字符串。mx记录了具有最长回文字符串的右边界。看下面这个图(注意,j为i关于id对称的点,j = 2*id - i):



但是p[i] = p[j]是没有错的,但是这里有个问题,就是i的一部分超出阴影部分,这就不对了。请看下图(为了看得更清楚,下面子串用细条纹表示):


      

其实核心的一句话就在于回文翻转了还是回文这一句.

图上也是在诠释这一句,所以,利用前面已经匹配过的最大的回文串,就是尽可能利用访问过的资源

图1中,以如果i大于mx的话,那么就完全没有前面的信息可以用,只好乖乖的一个一个左右匹配,

但是如果i<mx的话,那么就说明前面可以有相应的资源可以利用.因为以id的左右的回文肯定包括i关于id对称的j点处的一部分或者全部回文.

所以如果是包括全部的话就是图1的情况

如果只是包含部分的情况那么就是图2.

此时,根据对称型只能得出p[i]和p[j]红色阴影部分是相等的,这就为什么有取最小值这个操作:

 

if(mx > i)  //在这个之类可以借助前面算的一部分
    p[i] = min(mx - i,p[2 * id - i]);  

     下面代码就很容易看懂了。

      最后遍历一遍p数组,找出最大的p[i]-1就是所求的最长回文字符串长度,下面证明一下:

    (1)因为p[i]记录插入分隔符之后的回文字符串半径,注意插入分隔符之后的字符串中的回文字符串肯定是奇数长度,所以以i为中心的回文字符串长度为2*p[i]-1。

例如:bb=>#b#b#

           bab=>#b#a#a#b#

    (2)注意上面两个例子的关系。#b#b#减去一个#号的长度就是原来的2倍。即((2*p[i]-1)-1)/2 = p(i)-1,得证。

       算法的有效比较次数为MaxId 次,所以说这个算法的时间复杂度为O(n)。

### 寻找最长回文子串的Python实现 以下是几种常见的方法及其对应的Python代码实现: #### 方法一:暴力搜索法 这种方法通过枚举所有可能的子串并逐一验证其是否为回文,最终找出最长的那个。尽管其实现简单直观,但由于时间复杂度较高 \(O(n^3)\),因此仅适用于较短的输入字符串。 ```python def longestPalindrome_brute_force(s): def is_palindrome(substring): return substring == substring[::-1] n = len(s) max_len = 0 start = 0 for i in range(n): for j in range(i, n): if is_palindrome(s[i:j+1]) and (j - i + 1) > max_len: max_len = j - i + 1 start = i return s[start:start + max_len] ``` 此方法基于暴力搜索的概念[^1]。 --- #### 方法二:动态规划法 动态规划是一种更为高效的解决方案,能够显著降低时间复杂度至 \(O(n^2)\)。核心思想在于构建一个二维布尔数组 `dp` 来记录每种子串的状态,并逐步填充这些状态以推导出最优解。 ```python def longestPalindrome_dp(s): n = len(s) if n < 2: return s dp = [[False]*n for _ in range(n)] max_len = 1 start = 0 # 初始化单个字符的情况 for i in range(n): dp[i][i] = True # 填充 dp 表格 for length in range(2, n+1): # 子串长度从2开始 for i in range(n-length+1): j = i + length - 1 if s[i] == s[j]: if length == 2 or dp[i+1][j-1]: dp[i][j] = True if length > max_len: max_len = length start = i return s[start:start + max_len] ``` 上述代码实现了动态规划的思想[^3]。 --- #### 方法三:中心扩展法 中心扩展法通过选定每个潜在的回文中心位置并向两侧扩展的方式查找最大回文子串。由于每次只需检查有限数量的位置,故整体性能优于前两种方法,时间复杂度同样为 \(O(n^2)\)。 ```python def expand_around_center(s, left, right): while left >= 0 and right < len(s) and s[left] == s[right]: left -= 1 right += 1 return s[left+1:right], right-left-1 def longestPalindrome_expand(s): if not s: return "" result = "" max_length = 0 for i in range(len(s)): odd_str, odd_len = expand_around_center(s, i, i) # 中心是一个字符 even_str, even_len = expand_around_center(s, i, i+1) # 中心是两个相邻字符 current_max = odd_str if odd_len > even_len else even_str if len(current_max) > max_length: result = current_max max_length = len(result) return result ``` 这段代码展示了中心扩展法的具体应用。 --- #### 方法四:Manacher算法 作为最先进的解决策略之一,Manacher算法能够在 \(O(n)\) 时间内完成任务。它的关键是通过对称性质减少不必要的比较次数,同时引入辅助变量跟踪当前已知的最大覆盖范围。 ```python def preprocess(s): if not s: return "^$" processed_s = "^" for char in s: processed_s += "#" + char processed_s += "#$" return processed_s def longestPalindrome_manacher(s): T = preprocess(s) P = [0] * len(T) C = R = 0 for i in range(1, len(T)-1): mirror_i = 2*C - i if R > i: P[i] = min(R-i, P[mirror_i]) # 尝试扩展回文半径 while T[i + 1 + P[i]] == T[i - 1 - P[i]]: P[i] += 1 # 更新最右边界R和中心C if i + P[i] > R: C, R = i, i + P[i] # 找到最大的P[i] max_len = 0 center_index = 0 for i in range(1, len(T)-1): if P[i] > max_len: max_len = P[i] center_index = i start = (center_index - max_len) // 2 return s[start:start + max_len] ``` 这是 Manacher 算法的一个典型例子[^4]。 --- ### 结论 以上四种方法各有优劣,在实际开发过程中可根据需灵活选用合适的方案。如果追极致效率,则推荐采用 Manacher 算法;而对于初学者或者小型项目而言,动态规划或中心扩展法则更加易于理解和维护。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值