【题解】洛谷P6793 [SNOI2020] 字符串

最新推荐文章于 2025-06-06 09:47:56 发布

原创最新推荐文章于 2025-06-06 09:47:56 发布 · 329 阅读

0 ·

CC 4.0 BY-SA版权

题解同时被 2 个专栏收录

5 篇文章

订阅专栏

字符串

2 篇文章

订阅专栏

本文介绍如何使用SAM算法解决字符串子串一致性问题，通过构建后缀链接树并匹配子串，找到最长公共后缀，以最少成本使两个字符串集合相等。关键步骤包括反串建立SAM树、拓扑排序和后缀匹配。

【题解】P6793 [SNOI2020] 字符串（SAM）

$\rm Description$

有两个长度为 $n$ 的由小写字母组成的字符串 $a, b$ ，取出他们所有长为 $k$ 的子串（各有 $n - k + 1$ 个），这些子串分别组成集合 $A, B$ 。现在要修改 $A$ 中的串，使得 $A$ 和 $B$ 完全相同。可以任意次选择修改 $A$ 中一个串的一段后缀，花费为这段后缀的长度。总花费为每次修改花费之和，求总花费的最小值。

输入格式
第一行两个整数 $n, k$ 表示字符串长度和子串长度；
第二行一个小写字母字符串 $a$ ；
第三行一个小写字母字符串 $b$ 。

输出格式
输出一行一个整数表示总花费的最小值。

输入输出样例
输入

5 3
aabaa
ababa

输出

对于所有数据， $1≤k≤n≤1.5×10^5$ 。

$\rm Solution$

由于修改的是子串的后缀，也就是前缀是相同的，问题可以转化为对集合 $A$ 和 $B$ 的子串进行匹配，使其公共前缀的长度和最大，即 $\sum\limits_{i=1}^n lcp(A_i,B_i)$ 最大。

$\rm SAM$ 只能处理后缀，可以用反串建立 $\rm SAM$ 处理。
两个子串的最长公共后缀等于其在 $\rm parent$ $\rm tree$ （也有人称为后缀链接）上的最近公共祖先（ $\rm LCA$ ）。
为了方便处理，将两个字符串 $a, b$ 拼起来，记为 $s$ ，用 $s$ 的反串建立 $\rm SAM$ ，再在 $\rm parent$ $\rm tree$ 上区分 $a, b$ 进行匹配。

记 $s u m$ 为当前公共前缀的长度和，当匹配至节点 $i$ 时，有 $s1_i$ 个 $a$ 的 $l e n$ 大于等于 $k$ 的子串（由于求的是最长公共后缀，所以 $l e n$ 不需要等于 $k$ ）、有 $s2_i$ 个 $b$ 的 $l e n$ 大于等于 $k$ 的子串没有在 $i$ 的儿子节点被匹配，有 $min(s1_i,s2_i)$ 对 $a, b$ 子串的 $\rm LCA$ 为节点 $i$ ，更新 $s u m$ ，剩下的部分则上传到父亲节点继续匹配。

答案为长度为 $k$ 的子串个数减去最大的公共前缀长度和，即 $(k * (n - k + 1) - s u m$ 。

$\rm Code$

#include<bits/stdc++.h>
using namespace std;
long long n,k;
int t[1000005],a[1000005];
char s[500005];
struct node{
	int nex[26];
	int fa;
	long long len,sum[2];
	node(){memset(nex,0,sizeof(nex)); len=0;}
}d[1000005];
int tot=1,las=1;
long long ans;
void add(int c,int val,int jud)
{
	int p=las,np=las=++tot; d[np].sum[jud]=val;
	d[np].len=d[p].len+1;
	for(; p && !d[p].nex[c]; p=d[p].fa) d[p].nex[c]=np;
	if(!p) d[np].fa=1;
	else
	{
		int q=d[p].nex[c];
		if(d[q].len == d[p].len+1) d[np].fa=q;
		else
		{
			int nq=++tot; 
			memcpy(d[nq].nex,d[q].nex,sizeof(d[nq].nex));
			d[nq].fa=d[q].fa;
			d[nq].len=d[p].len+1;
			d[q].fa=d[np].fa=nq;
			for(; p && d[p].nex[c]==q; p=d[p].fa) d[p].nex[c]=nq;
		}
	}
}
void tsort() //拓扑排序
{
	for(int i=1; i<=tot; i++) t[d[i].len]++;
	for(int i=1; i<=tot; i++) t[i]+=t[i-1];
	for(int i=1; i<=tot; i++) a[t[d[i].len]--]=i;
}
int main()
{
	scanf("%lld%lld",&n,&k);
	scanf("%s",s);
	for(int i=n-1; i>=0; i--) add(s[i]-'a',(i+k-1<n),0);
	scanf("%s",s);
	for(int i=n-1; i>=0; i--) add(s[i]-'a',(i+k-1<n),1);
	int lens=n<<1;
	tsort();
	int mins;
	for(int i=tot; i; i--)
	{
		mins=min(d[a[i]].sum[0],d[a[i]].sum[1]);
		ans+=mins*min(k,d[a[i]].len);
		d[a[i]].sum[0]-=mins;
		d[a[i]].sum[1]-=mins;
		d[d[a[i]].fa].sum[0]+=d[a[i]].sum[0];
		d[d[a[i]].fa].sum[1]+=d[a[i]].sum[1];
	}
	ans=k*(n-k+1)-ans;
	printf("%lld",ans);
	return 0;
}