[AHOI2013]差异 后缀数组+并查集

本文介绍了一种使用后缀数组和并查集解决字符串匹配问题的方法,通过计算字符串的所有后缀,利用后缀数组进行排序,并通过并查集处理字符串的公共前缀长度,最终求解特定数学表达式的值。

Description
给一个长度为n的字符串,Ti表示i为后缀的字符串,求:
∑1&lt;=j&lt;i&lt;=nlen(Ti)+len(Tj)−2∗LCP(Ti,Tj)\sum_{1&lt;=j&lt;i&lt;=n}len(Ti)+len(Tj)-2*LCP(Ti,Tj)1<=j<i<=nlen(Ti)+len(Tj)2LCP(Ti,Tj)


Sample Input
cacao


Sample Output
54


后缀数组+并查集套路题,没什么好说的。。。


#include <cstdio>
#include <cstring>
#include <algorithm>

using namespace std;
int _min(int x, int y) {return x < y ? x : y;}
typedef unsigned long long ULL;
typedef long long LL;
const ULL P = 131;

struct node {
	int x, id;
} height[510000];
LL f[510000];
char ss[510000];
ULL s[510000], o[510000];
int n, m, a[510000], Rank[510000], Rsort[510000], sa[510000], yy[510000];
int fa[510000], tot[510000];

bool cmp(node a, node b) {return a.x > b.x;}

int findfa(int x) {
	if(fa[x] != x) fa[x] = findfa(fa[x]);
	return fa[x];
}

void get_sa() {
	memcpy(Rank, a, sizeof(Rank));
	for(int i = 1; i <= n; i++) Rsort[Rank[i]]++;
	for(int i = 1; i <= m; i++) Rsort[i] += Rsort[i - 1];
	for(int i = n; i >= 1; i--) sa[Rsort[Rank[i]]--] = i;
	int ln = 1, p;
	while(p < n) {
		int k = 0;
		for(int i = n - ln + 1; i <= n; i++) yy[++k] = i;
		for(int i = 1; i <= n; i++) if(sa[i] - ln > 0) yy[++k] = sa[i] - ln;
		memset(Rsort, 0, sizeof(Rsort));
		for(int i = 1; i <= n; i++) Rsort[Rank[i]]++;
		for(int i = 1; i <= m; i++) Rsort[i] += Rsort[i - 1];
		for(int i = n; i >= 1; i--) sa[Rsort[Rank[yy[i]]]--] = yy[i];
		for(int i = 1; i <= n; i++) yy[i] = Rank[i];
		p = 1; Rank[sa[1]] = 1;
		for(int i = 2; i <= n; i++) {
			if(yy[sa[i]] != yy[sa[i - 1]] || yy[sa[i] + ln] != yy[sa[i - 1] + ln]) p++;
			Rank[sa[i]] = p;
		} m = p, ln *= 2;
	}
}

LL sum(int x) {return (LL)x * (x - 1) / 2;}

int main() {
	scanf("%s", ss + 1);
	n = strlen(ss + 1);
	for(int i = 1; i <= n; i++) a[i] = ss[i] - 'a' + 1;
	o[0] = 1; for(int i = 1; i <= n; i++) o[i] = o[i - 1] * P, s[i] = s[i - 1] * P + a[i];
	m = 26; get_sa();
	LL ans = (LL)(n + 1) * n / 2 * (n - 1);
	for(int i = 1; i < n; i++) {
		int x = sa[i], y = sa[i + 1];
		int l = 1, r = _min(n - x + 1, n - y + 1), ans = 0;
		while(l <= r) {
			int mid = (l + r) / 2;
			if(s[x + mid - 1] - s[x - 1] * o[mid] == s[y + mid - 1] - s[y - 1] * o[mid]) l = mid + 1, ans = mid;
			else r = mid - 1;
		} height[i].x = ans, height[i].id =i; 
	} sort(height + 1, height + n, cmp);
	for(int i = 1; i <= n; i++) fa[i] = i, tot[i] = 1;
	LL hh = 0, u = height[1].x;
	for(int i = 1; i < n; i++) {
		if(height[i].x != height[i - 1].x && i != 1) f[height[i - 1].x] = hh;
		if(height[i].x == 0) break;
		int x = sa[height[i].id], y = sa[height[i].id + 1];
		int fx = findfa(x), fy = findfa(y);
		hh -= sum(tot[fx]), hh -= sum(tot[fy]);
		tot[fy] += tot[fx], fa[fx] = fy;
		hh += sum(tot[fy]);
	} if(height[n - 1].x) f[height[n - 1].x] = hh;
	for(int i = 1; i <= u; i++) {
		f[i] -= f[i + 1];
		ans -= f[i] * i * 2;
	} printf("%lld\n", ans);
	return 0;
}
### 关于可撤销并查集的洛谷练习题及相关数据结构 #### 可撤销并查集简介 可撤销并查集是一种扩展版本的并查集,能够在执行合并操作的同时保留回退的能力。这意味着可以在任意时刻撤消最近的一次 `union` 操作,从而恢复到之前的状态。这一特性使得该数据结构非常适合解决涉及动态连通性和历史状态查询的问题。 实现可撤销并查集的核心在于记录每次路径压缩或合并操作的变化,并将其存入栈中以便后续回溯。具体来说,在标准并查集中引入额外的数据结构(如栈)来保存父节点指针的历史修改情况[^1]。 下面是一些适合初学者和中级选手练习的洛谷平台上的题目: --- #### 推荐洛谷练习题 1. **P2860 [USACO06FEB]Redundant Paths G** 这道题考察的是如何利用带权并查集或者可撤销并查集计算最小边数使图成为双联通分量。虽然不强制要求使用可撤销并查集,但如果尝试用此方法解题会更加直观。 题目链接: https://www.luogu.com.cn/problem/P2860 2. **P3970 [TJOI2015]线性代数** 虽然名字看起来与矩阵运算有关,但实际上可以通过构建虚拟点的方式转化为经典的并查集问题。进一步优化时可以考虑加入可撤销机制以应对复杂度较高的测试样例。 题目链接: https://www.luogu.com.cn/problem/P3970 3. **P4180 [BJOI2012]树的难题** 此题需要维护森林中的多个独立子树之间的连接关系,并支持删除某些边的操作。因此非常适合作为学习可撤销并查集的应用实例之一。 题目链接: https://www.luogu.com.cn/problem/P4180 4. **P2024 [AHOI2009]中国象棋** 将二维网格抽象成一维数组之后,可以用带有时间戳功能的可撤销并查集高效解答本题提出的询问类问题。 题目链接: https://www.luogu.com.cn/problem/P2024 --- #### 实现代码示例 以下是一个简单的 C++ 版本的可撤销并查集模板程序: ```cpp #include <bits/stdc++.h> using namespace std; struct UndoUnionFind { vector<int> parent; vector<pair<int, int>> history; // 记录每一次改变 (x, old_parent) UndoUnionFind(int n): parent(n){ for(int i=0;i<n;i++) parent[i]=i; } int find_set(int x) { while(parent[x]!=x){ history.emplace_back(x,parent[x]); parent[x]=parent[parent[x]]; // Path compression x=parent[x]; } return x; } bool unite_sets(int x, int y){ int fx=find_set(x); int fy=find_set(y); if(fx !=fy ){ history.emplace_back(fy,fy); // Record the change of root node's father. parent[fy]=fx; return true; } return false; } void undo(){ if(history.empty())return ; auto &[node,new_father]=history.back(); parent[node]=new_father; history.pop_back(); } }; int main() { int n,m,q; cin >> n >> m >> q; UndoUnionFind uf(n+1); for(int i=0;i<m;i++){ int u,v; cin>>u>>v; uf.unite_sets(u,v); } while(q--){ string cmd; cin>>cmd; if(cmd=="undo"){ uf.undo(); }else{ int u,v; cin>>u>>v; cout <<(uf.find_set(u)==uf.find_set(v)? "YES":"NO")<<'\n'; } } } ``` --- #### 总结 通过以上介绍可以看出,掌握好基础版并查集的基础上再去深入理解其变种形式——比如种类并查集以及今天的主题可撤销并查集——对于提高算法竞赛水平至关重要。这些技巧不仅限于比赛场景下有用,在实际软件开发过程中也可能遇到类似的逻辑需求。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值