bzoj1921 [CTSC2010]珠宝商 SAM+后缀树+点分治

本文介绍了一道关于树和字符串匹配自动机(SAM)的算法题,目标是计算所有路径组成的字符串在给定字符串中出现次数的总和。通过点分治策略和SAM结构的应用,实现了高效求解。

Description


有一棵n个节点的树和一个长度为m的字符串S,树上每个节点有一个字符。问对于任意的有序数对(x,y),从x到y路径组成的字符串在S中出现次数的和。
n,m≤5⋅104n,m\le5\cdot10^4n,m5104

Solution


很显然要在SAM上跑,我们要求的是所有路径组成的串在SAM上size的和,那么一个显然的响法就是我们点分治然后合并跨越不同子树的路径

记当前分治重心为rt,那么我们要求的就是若干条(x,rt)和(rt,y)这样路径的并组成的串在SAM上的size
这个可以正反建两个SAM,然后用SAM求出后缀树,那么所有(x,rt)都可以看作是c[rt]加上若干个前缀字符得到的新串,并且恰好就是它后缀树上到根的路径,那么我们对每个节点打出现次数+1的标记然后O(m)暴力下传就可以做到O(nlogn+nm)的复杂度了

我们发现这样做还是不行,考虑平衡规划一下。一个暴力就是我们枚举一条路径的起点,然后暴力dfs并顺便在SAM上求size。这样直接做是O(n^2)的。对于>n>\sqrt n>n的子树我们用点分治搞,其余的子树我们直接上这个暴力。可以证明一棵树大小超过根号的子树不超过根号个,小于根号的我们一遇到就退掉也只会遍历根号个,那么总的复杂度就是十分科学的了

Code


#include <stdio.h>
#include <string.h>
#include <algorithm>
#include <math.h>
#define rep(i,st,ed) for (register int i=st;i<=ed;++i)
#define drp(i,st,ed) for (register int i=st;i>=ed;--i)
#define copy(x,t) memcpy(x,t,sizeof(x))

typedef long long LL;
const int INF=0x3f3f3f3f;
const int N=100005;

struct edge {int y,next;} e[N*2];

int ls[N],v[N],edCnt,rt,sum;
int size[N],mx[N],n,m,B;
char c[N],str[N]; LL ans;

bool del[N];

struct SAM {
	int s[N],id[N],a[N],b[N],rig[N],size[N],tot,last;
	int rec[N][26],son[N][26],tag[N],fa[N],mx[N];

	int extend(int ch,int pos) {
		int p,q,np,nq;
		p=last; np=last=++tot; mx[np]=mx[p]+1;
		rig[np]=pos; size[np]++;
		for (;p&&!rec[p][ch];p=fa[p]) rec[p][ch]=np;
		if (!p) fa[np]=1;
		else {
			q=rec[p][ch];
			if (mx[q]==mx[p]+1) fa[np]=q;
			else {
				nq=++tot; mx[nq]=mx[p]+1;
				copy(rec[nq],rec[q]);
				fa[nq]=fa[q];
				fa[np]=fa[q]=nq;
				for (;p&&rec[p][ch]==q;p=fa[p]) rec[p][ch]=nq;
			}
		}
		return last;
	}

	void build() {
		tot=last=1;
		rep(i,1,m) id[i]=extend(s[i],i);
		rep(i,1,tot) b[mx[i]]++;
		rep(i,1,tot) b[i]+=b[i-1];
		drp(i,tot,1) a[b[mx[i]]--]=i;
		drp(i,tot,2) {
			int x=a[i];
			if (!rig[fa[x]]) rig[fa[x]]=rig[x];
			son[fa[x]][s[rig[x]-mx[fa[x]]]]=x;
			size[fa[x]]+=size[x];
		}
	}

	void col(int x,int fa,int now,int len) {
		if (len==mx[now]) now=son[now][c[x]];
		else if (s[rig[now]-len]!=c[x]) now=0;
		if (!now) return ;
		tag[now]++;
		for (int i=ls[x];i;i=e[i].next) {
			if (e[i].y==fa||del[e[i].y]) continue;
			col(e[i].y,x,now,len+1);
		}
	}

	void push() {
		rep(i,1,tot) tag[a[i]]+=tag[fa[a[i]]];
	}

	void clear() {
		rep(i,1,tot) tag[i]=0;
	}
} SAM1,SAM2;

void add_edge(int x,int y) {
	e[++edCnt]=(edge) {y,ls[x]}; ls[x]=edCnt;
	e[++edCnt]=(edge) {x,ls[y]}; ls[y]=edCnt;
}

void get_size(int x,int fa) {
	size[x]=1; mx[x]=0;
	for (int i=ls[x];i;i=e[i].next) {
		if (e[i].y==fa||del[e[i].y]) continue;
		get_size(e[i].y,x); size[x]+=size[e[i].y];
		mx[x]=std:: max(mx[x],size[e[i].y]);
	}
	mx[x]=std:: max(mx[x],sum-size[x]);
	if (mx[x]<mx[rt]) rt=x;
}

void dfs(int x,int fa,int now) {
	now=SAM1.rec[now][c[x]];
	if (!now) return ;
	ans+=SAM1.size[now];
	for (int i=ls[x];i;i=e[i].next) {
		if (e[i].y==fa||del[e[i].y]) continue;
		dfs(e[i].y,x,now);
	}
}

void get(int x,int fa) {
	v[++v[0]]=x;
	for (int i=ls[x];i;i=e[i].next) {
		if (e[i].y==fa||del[e[i].y]) continue;
		get(e[i].y,x);
	}
}

void change(int x,int fa,int xs) {
	SAM1.clear(); SAM2.clear();
	if (fa) {
		SAM1.col(x,fa,SAM1.son[1][c[fa]],1);
		SAM2.col(x,fa,SAM2.son[1][c[fa]],1);
	} else {
		SAM1.col(x,0,1,0);
		SAM2.col(x,0,1,0);
	}
	SAM1.push();
	SAM2.push();
	rep(i,1,m) ans+=SAM1.tag[SAM1.id[i]]*SAM2.tag[SAM2.id[m-i+1]]*xs;
}

void solve(int x) {
	if (size[x]<=B) {
		v[0]=0; get(x,0);
		rep(i,1,v[0]) dfs(v[i],0,1);
		return ;
	}
	del[x]=1;
	change(x,0,1);
	for (int i=ls[x];i;i=e[i].next) {
		if (del[e[i].y]) continue;
		change(e[i].y,x,-1);
	}
	for (int i=ls[x];i;i=e[i].next) {
		if (del[e[i].y]) continue;
		sum=size[e[i].y]; rt=0;
		get_size(e[i].y,x);
		solve(rt);
	}
}

int main(void) {
	scanf("%d%d",&n,&m); B=sqrt(n);
	rep(i,2,n) {
		int x,y; scanf("%d%d",&x,&y);
		add_edge(x,y);
	}
	scanf("%s",c+1);
	rep(i,1,n) c[i]-='a';
	scanf("%s",str+1);
	rep(i,1,m) SAM1.s[i]=str[i]-'a',SAM2.s[m-i+1]=str[i]-'a';
	SAM1.build(),SAM2.build();
	mx[rt=0]=INF; sum=n;
	get_size(1,0);
	solve(rt);
	printf("%lld\n", ans);
	return 0;
}
### BZOJ1728 Two-Headed Cows (双头牛) 的解题思路 #### 题目概述 BZOJ1728 是一道经典的图论问题,题目描述了一群双头牛之间的关系网络。每只双头牛可以看作是一个节点,而它们的关系则构成了边。目标是从这些关系中找出满足特定条件的最大子集。 此问题的核心在于利用 **二分查找** 和 **染色法** 来验证是否存在符合条件的子图结构[^1]。 --- #### 解题核心概念 ##### 1. 图模型构建 该问题可以通过无向图建模,其中每个顶点代表一只双头牛,边表示两只双头牛之间存在某种关联。最终的目标是在这个图中找到最大的独立集合(Independent Set),即任意两个顶点都不相连的一组顶点[^2]。 ##### 2. 二分查找的应用 为了高效求解最大独立集大小 \( k \),采用二分策略来逐步逼近最优解。具体来说,在区间 [0, n] 中通过不断调整上下界寻找可能的最大值 \( k \)[^3]。 ##### 3. 染色法验证可行性 对于当前假设的最大独立集大小 \( mid \),尝试从原图中选取恰好 \( mid \) 个顶点构成候选集合,并检查其是否形成合法的独立集。这一过程通常借助 BFS 或 DFS 实现,同时配合颜色标记技术区分已访问状态以及检测冲突情况[^4]。 以下是基于 Python 的伪代码实现: ```python from collections import deque def bfs_coloring(graph, start_node): queue = deque() color_map = {} # 初始化起点的颜色为 0 color_map[start_node] = 0 queue.append(start_node) while queue: current = queue.popleft() for neighbor in graph[current]: if neighbor not in color_map: # 给邻居分配相反的颜色 color_map[neighbor] = 1 - color_map[current] queue.append(neighbor) elif color_map[neighbor] == color_map[current]: return False # 如果发现相邻节点有相同颜色,则无法完成有效染色 return True def is_possible_to_select_k(graph, nodes_count, target_size): from itertools import combinations all_nodes = list(range(nodes_count)) possible_combinations = combinations(all_nodes, target_size) for subset in possible_combinations: subgraph = {node: [] for node in subset} valid_subset = True for u in subset: for v in graph[u]: if v in subset and v != u: subgraph[u].append(v) # 对子图进行染色测试 colors_used = set() coloring_success = True for node in subset: if node not in colors_used: success = bfs_coloring(subgraph, node) if not success: coloring_success = False break if coloring_success: return True # 找到一个有效的组合即可返回成功标志 return False def binary_search_max_independent_set(graph, total_nodes): low, high = 0, total_nodes best_result = 0 while low <= high: mid = (low + high) // 2 if is_possible_to_select_k(graph, total_nodes, mid): best_result = mid low = mid + 1 else: high = mid - 1 return best_result ``` --- #### 复杂度分析 上述算法的时间复杂度主要取决于以下几个方面: - 枚举所有可能的子集规模:\( O(\binom{n}{k}) \), 其中 \( k \) 表示当前试探的独立集大小。 - 子图构造与染色检验操作:每次调用 `bfs_coloring` 函数需遍历整个子图,最坏情况下时间开销接近线性级别 \( O(k^2) \). 综合来看整体效率较高但仍有优化空间[^5]. --- #### 总结 通过对 BZOJ1728 进行深入剖析可知,合理运用二分加染色的方法能够显著提升解决问题的能力。这种方法不仅适用于本题场景下寻找最大独立集的任务需求,同时也可推广至其他相似类型的 NP 完全难题处理之中[^6]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值