求两个字符串的LCS(最长公共子串)后缀数组

本文介绍了一种利用后缀数组求解两个字符串最长公共子串的方法。通过构建后缀数组和height数组,找出最大公共前缀,从而确定最长公共子串的长度。题目提供例子说明,强调了确保选取的后缀来自不同字符串。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题意:

给两个字符串,求出它们的最长公共子串的长度。

比如

yeshowmuchiloveyoumydearmotherreallyicannotbelieveit
yeaphowmuchiloveyoumydearmother

它们的最长公共子串为howmuchiloveyoumydearmother,一共有27个字符。

 

题解:

没有什么好说的,后缀数组模板题,会求后缀数组sa和height数组就行。

height[i]是排名为i的后缀和排名为i-1的后缀的最长公共前缀。那么只需要找到最大的height[i]就行了

同时注意需要保证找到的两个后缀来自不同的字符串。

#pragma warning(disable:4996)
#include<iostream>
#include<algorithm>
#include<cstdio>
#include<map>
#include<cmath>
#include<vector>
#include<stack>
#include<set>
#include<queue>
#include<cstring>
#include<string>
#include<bitset>
using namespace std;
typedef long long ll;
const ll mod = 998244353;
const ll maxn = 4e5 + 5;
char s[maxn], s2[maxn];
int sa[maxn], height[maxn], x[maxn], y[maxn];
int c[maxn], rk[maxn];
int n, m = 130;
//后缀数组模板
void getsuffixarray() {
	int i, j, k;
	for (i = 1; i <= n; i++)c[x[i] = s[i]]++;
	for (i = 2; i <= m; i++)c[i] += c[i - 1];
	for (i = n; i >= 1; i--)sa[c[x[i]] --] = i;//基数排序,从后往前
	//按照后缀的第一个字符排序
	for (k = 1; k <= n; k <<= 1)
	{
		int num = 0;
		for (i = n - k + 1; i <= n; i++)y[++num] = i;//y[i]表示第二关键字排名为i的元素的第一关键字
		//后面的k个没有第二关键字,排在最前面
		for (i = 1; i <= n; i++)if (sa[i] > k)y[++num] = sa[i] - k;
		//第二关键字大于k,对应的第一关键字就是它减去k
		for (i = 1; i <= m; i++)c[i] = 0;
		for (i = 1; i <= n; i++)c[x[i]]++;
		for (i = 2; i <= m; i++)c[i] += c[i - 1];//前缀和
		for (i = n; i >= 1; i--)sa[c[x[y[i]]]--] = y[i];//按照第二关键字排序
		swap(x, y);
		x[sa[1]] = 1;
		num = 1;
		for (i = 2; i <= n; i++)//生成下一次的第一关键字
			x[sa[i]] = (y[sa[i]] == y[sa[i - 1]] && y[sa[i] + k] == y[sa[i - 1] + k]) ? num : ++num;
		if (num == n)break;
		m = num;
	}
}
void getheight() {
	int i, j, k =0;
	for (i = 1; i <= n; i++)rk[sa[i]] = i;
	for (i = 1; i <= n; i++)
	{
		if (rk[i] == 1)continue;
		if (k)k--;
		j = sa[rk[i] - 1];//第i个后缀排名的前一个后缀
		while (j + k <= n && i + k <= n && s[i + k] == s[j + k])k++;
		height[rk[i]] = k;
	}
}
int main()
{
	int l1;
	scanf("%s", s + 1);
	l1 = strlen(s + 1);
	scanf("%s", s + 1 + l1);
	n = strlen(s + 1);
	getsuffixarray();
	getheight();
	/*for (int i = 1; i <= n; i++)
		cout << height[i] << " ";*/

	int MAX = 0;
	for (int i = 1; i <= n; i++)
	{
		if (height[i] > MAX && ((sa[i] <=l1 && sa[i-1] >l1)||(sa[i] >l1 && sa[i-1] <=l1)))
			//保证这两个后缀来自不同的串
			MAX = height[i];
	}
	cout << MAX << endl;

	return 0;
}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值