最长可重叠的重复子串

题目大意:给定一个字符串,求它的最长可重叠的重复子串的长度

思路:求出height数组之后,输出最大值即可。因为最长可重叠的重复子串一定是在相邻两个后缀的最长公共前缀,即height,而要求最大值,输出height最大值即可

#include<cstdio>
#include<cstring>
#define max(a,b) a>b?a:b
using namespace std;
const int maxl=400000;
int sa[maxl+10],tsa[maxl+10],rank[maxl+10],trank[maxl+10],sum[maxl+10],n,h[maxl+10];
char s[maxl+10];

void sorts(int j){
	memset(sum,0,sizeof(sum));
	for (int i=1;i<=n;i++) sum[rank[i+j]]++;
	for (int i=1;i<=n;i++) sum[i]+=sum[i-1];
	for (int i=n;i>0;i--) tsa[sum[rank[i+j]]--]=i;
	
	memset(sum,0,sizeof(sum));
	for (int i=1;i<=n;i++) sum[rank[tsa[i]]]++;
	for (int i=1;i<=n;i++) sum[i]+=sum[i-1];
	for (int i=n;i>0;i--) sa[sum[rank[tsa[i]]]--]=tsa[i];
}

void getsa(){
	for (int i=1;i<=n;i++) trank[i]=s[i];
	for (int i=1;i<=n;i++) sum[trank[i]]++;
	for (int i=1;i<=255;i++) sum[i]+=sum[i-1];
	for (int i=n;i>0;i--) sa[sum[trank[i]]--]=i;
	rank[sa[1]]=1;
	for (int i=2,p=1;i<=n;i++){
		if (trank[sa[i]]!=trank[sa[i-1]]) p++;
		rank[sa[i]]=p;
	}
	for (int j=1;j<=n;j*=2){
		sorts(j);
		trank[sa[1]]=1;
		for (int i=2,p=1;i<=n;i++){
			if (rank[sa[i]]!=rank[sa[i-1]]||rank[sa[i]+j]!=rank[sa[i-1]+j]) p++;
			trank[sa[i]]=p;
		}
		memcpy(rank,trank,sizeof(rank));
	}
}

void geth(){
	for (int i=1,j=0;i<=n;i++){
		if (rank[i]==1) continue;
		while (s[i+j]==s[sa[rank[i]-1]+j]) j++;
		h[rank[i]]=j;
		if (j>0) j--;
	}
}

int main(){
	scanf("%d",&n);
	scanf("%s",s+1);
	getsa();
	geth();
	int maxs=0;
	for (int i=1;i<=n;i++)
		maxs=max(maxs,h[i]);
	printf("%d\n",maxs);
	//for (;;);
	return 0;
}

在数据结构应用中,求解最长重复子有多种算法和解决方案。 ### 暴力解法 直观的暴力解法是检查每一个可能的子,然后找出最长重复子。不过这种方法时间复杂度较高,尤其是当字符很长时,可能达到 $O(n^3)$,因为要遍历所有子,每个子还要检查是否有重复。对于较长的输入,该方法效率太低 [^2]。 ### 双指针技术 双指针技术可用于解决最长重复子问题,通过巧妙地控制指针的移动和窗口的边界,能高效地解决问题,是处理字符相关问题的重要方法之一。虽然这里是最长重复子,但思想可借鉴,在处理最长重复子时,可尝试通过指针控制窗口来找出重复子 [^1]。 ### 动态规划 动态规划主要用于解决具有重叠子问题和最优子结构性质的问题。它通过将问题分解为子问题来解决复杂问题,每个子问题仅解决一次,并将其结果存储,以供后续使用,从而避免了重复计算。对于最长重复子问题,可尝试按照动态规划的步骤来解决: 1. **分解问题**:将问题分解为子问题,这些子问题的解决方案可以组合成原问题的解决方案。 2. **识别最优子结构**:问题的最优解包含其子问题的最优解。 3. **存储中间结果**:使用一个数组或表格来存储已经解决的子问题的结果,以避免重复计算。 4. **定义子问题**:确定如何将原问题分解成子问题。 5. **递推公式**:找到子问题之间的关系,形成递推公式(状态转移方程)。 6. **边界条件**:确定最小子问题的解(边界条件)。 7. **填表格**:根据递推公式和边界条件,从小问题开始逐步计算出大问题的解 [^4]。 ```python def longest_repeated_substring(s): n = len(s) # 创建二维数组 dp dp = [[0] * (n + 1) for _ in range(n + 1)] max_length = 0 end_index = 0 for i in range(1, n + 1): for j in range(i + 1, n + 1): if s[i - 1] == s[j - 1]: dp[i][j] = dp[i - 1][j - 1] + 1 if dp[i][j] > max_length: max_length = dp[i][j] end_index = i - 1 else: dp[i][j] = 0 # 提取最长重复子 if max_length > 0: return s[end_index - max_length + 1:end_index + 1] return "" # 测试 s = "banana" print(longest_repeated_substring(s)) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值