树上启发式合并/dsu on tree的简单应用

本文介绍了树上启发式合并的算法思想,通过分析多个相关题目,如洛谷-树上数颜色、CF600E、赛氪树的果实和CF1709EXOR树,展示了如何在树形结构中动态维护每个节点子树的颜色种类、主导颜色和路径异或等信息,从而解决相关问题。

树上启发式合并/dsu on tree

什么是树上启发式合并会依据第一道题目进行简单讲解。

题目1 洛谷-树上数颜色

题目大意

给我们一棵树,每个点有一个颜色,问我们每棵子树中的颜色种类数。

分析

考虑暴力,对于每个点我们都维护一个数组,表示该点表示的子树中的颜色种类,计算每个点的答案时,遍历整棵子树。时间复杂度为 n 2 n^2 n2,那怎么才能优化呢。
其实对于一个点,在计算完自己的答案后,他的数组就已经没用了,那我们是不是可以在所有儿子计算完答案后,将一个儿子的数组拿过来,然后将其他儿子的数组一一合并过来呢,当然是可以的。那一开始拿哪个儿子的数组最好呢,答案是他的重儿子。
所以我们首先将树轻重链剖分找出重儿子,维护一个全局的数组表示当前正在计算的点的信息。
先计算所有轻儿子的答案,每次计算完后都清空数组,最后计算重儿子的答案,计算完后不清空数组,而是暴力地将轻儿子的信息合并到重儿子上,最后作为这个点的答案。
这样做的时间复杂度是 O ( n l o g n ) O(nlogn) O(nlogn)

代码
#include<bits/stdc++.h>
using namespace std;
const int N = 1e5+10,M = 2e5+10;
int h[N],e[M],ne[M],idx;
void add(int a,int b){
	e[idx]=b,ne[idx]=h[a],h[a]=idx++;
}
int n,m;
int a[N];
int nowAns;
int cnt[N],ans[N];
int son[N],sz[N];
void dfs1(int u,int fa){
	sz[u]=1;
	for(int i=h[u];~i;i=ne[i]){
		int j=e[i];
		if(j==fa)continue;
		dfs1(j,u);
		if(sz[son[u]]<sz[j])son[u]=j;
		sz[u]+=sz[j];
	}
}
void go(int u,int fa,int f){
	cnt[a[u]]+=f;
	if(f==1&&cnt[a[u]]==1)nowAns++;
	if(f==-1&&cnt[a[u]]==0)nowAns--;
	for(int i=h[u];~i;i=ne[i]){
		int j=e[i];
		if(j==fa)continue;
		go(j,u,f);
	}
}
void dfs2(int u,int fa,bool del){
	for(int i=h[u];~i;i=ne[i]){
		int j=e[i];
		if(j==fa||j==son[u])continue;
		dfs2(j,u,true);
	}
	if(son[u])dfs2(son[u],u,false);
	cnt[a[u]]++;
	if(cnt[a[u]]==1)nowAns++;
	for(int i=h[u];~i;i=ne[i]){
		int j=e[i];
		if(j==fa||j==son[u])continue;
		go(j,u,1);
	}
	ans[u]=nowAns;
	if(del)go(u,fa,-1);
}
int main(){
	memset(h,-1,sizeof h);
	scanf("%d",&n);
	for(int i=1;i<n;i++){
		int a,b;
		scanf("%d%d",&a,&b);
		add(a,b),add(b,a);
	}
	for(int i=1;i<=n;i++)scanf("%d",&a[i]);
	dfs1(1,-1);
	dfs2(1,-1,false);
	scanf("%d",&m);
	while(m--){
		int x;
		scanf("%d",&x);
		printf("%d\n",ans[x]);
	}
	return 0;
}

题目2 CF 600E

题目大意

给我们一棵树,每棵树都有一个颜色编号,对于一棵子树,内部有很多个颜色,最多的颜色则占据主导地位,当然也可能有多种颜色占据主导地位,要我们求每棵子树占主导地位的颜色编号之和。

分析

与上一道题类似,我们只需要在计算答案时维护一个当前最大值 m x mx mx表示当前子树内每种颜色的个数的最大值,动态地更新这个值即可。
即若遍历到一个点时,该点代表颜色出现的次数 c n t [ a [ u ] ] cnt[a[u]] cnt[a[u]]大于 m x mx mx,我们就将 c n t [ a [ u ] ] cnt[a[u]] cnt[a[u]]赋给 m x mx mx,同时将 a [ u ] a[u] a[u]赋给 n o w A n s nowAns nowAns;若遍历到一个点时,该点代表颜色出现的次数 c n t [ a [ u ] ] cnt[a[u]] cnt[a[u]]等于 m x mx mx,我们就将 a [ u ] a[u] a[u]加到 n o w A n s nowAns nowAns上。

代码
#include<bits/stdc++.h>
using namespace std;
const int N = 1e5+10,M = 2e5+10;
int h[N],e[M],ne[M],idx;
void add(int a,int b){
	e[idx]=b,ne[idx]=h[a],h[a]=idx++;
}
int n,m;
int a[N];
int nowAns;
int cnt[N],ans[N];
int son[N],sz[N];
int mx;
void dfs1(int u,int fa){
	sz[u]=1;
	for(int i=h[u];~i;i=ne[i]){
		int j=e[i];
		if(j==fa)continue;
		dfs1(j,u);
		if(sz[son[u]]<sz[j])son[u]=j;
		sz[u]+=sz[j];
	}
}
void go(int u,int fa,int f){
	cnt[a[u]]+=f;
	if(f==1){
		if(cnt[a[u]]>mx){
			mx=cnt[a[u]];
			nowAns=a[u];
		}else if(cnt[a[u]]==mx){
			nowAns+=a[u];
		}		
	}
	else{
		mx=0;
		nowAns=0;
	}
	for(int i=h[u];~i;i=ne[i]){
		int j=e[i];
		if(j==fa)continue;
		go(j,u,f);
	}
}
void dfs2(int u,int fa,bool del){
	for(int i=h[u];~i;i=ne[i]){
		int j=e[i];
		if(j==fa||j==son[u])continue;
		dfs2(j,u,true);
	}
	if(son[u])dfs2(son[u],u,false);
	if(cnt[a[u]]==1)nowAns++;
	for(int i=h[u];~i;i=ne[i]){
		int j=e[i];
		if(j==fa||j==son[u])continue;
		go(j,u,1);
	}
	cnt[a[u]]++;
	if(cnt[a[u]]>mx){
		mx=cnt[a[u]];
		nowAns=a[u];
	}else if(cnt[a[u]]==mx){
		nowAns+=a[u];
	}
	ans[u]=nowAns;
	if(del)go(u,fa,-1);
}
int main(){
	memset(h,-1,sizeof h);
	scanf("%d",&n);
	for(int i=1;i<=n;i++)scanf("%d",&a[i]);
	for(int i=1;i<n;i++){
		int a,b;
		scanf("%d%d",&a,&b);
		add(a,b),add(b,a);
	}
	
	dfs1(1,-1);
	dfs2(1,-1,false);
	for(int i=1;i<=n;i++)printf("%d ",ans[i]);
	return 0;
}

题目3 赛氪 树的果实

题目大意

给我们一棵树,求每棵子树中 ( 每个数字出现的次数 ∗ 该数字 ) 2 (每个数字出现的次数*该数字)^2 (每个数字出现的次数该数字)2的和。

分析

如果这个题没有平方,那我们遇到一个数 a [ u ] a[u] a[u]就向 n o w A n s nowAns nowAns加一个 a [ u ] a[u] a[u]即可,但是有了评分我们应该怎么做呢,其实很简单,我们先减掉这个数之前的贡献,再加上 ( a [ u ] ∗ c n t [ a [ u ] ] ) 2 (a[u]*cnt[a[u]])^2 (a[u]cnt[a[u]])2即可。

代码
#include<bits/stdc++.h>
#define ll long long
using namespace std;
const int N = 1e5+10,M = 2e5+10;
int h[N],e[M],ne[M],idx;
void add(int a,int b){
	e[idx]=b,ne[idx]=h[a],h[a]=idx++;
}
int n,m,c;
ll a[N];
ll nowAns;
ll cnt[N],ans[N];
int son[N],sz[N];
void dfs1(int u){
	sz[u]=1;
	for(int i=h[u];~i;i=ne[i]){
		int j=e[i];
		dfs1(j);
		if(sz[son[u]]<sz[j])son[u]=j;
		sz[u]+=sz[j];
	}
}
void go(int u,int f){
	cnt[a[u]]+=f;
	if(f==1){
		int t=cnt[a[u]]-1;
		nowAns-=a[u]*t*a[u]*t;
		nowAns+=a[u]*cnt[a[u]]*a[u]*cnt[a[u]];		
	}
	for(int i=h[u];~i;i=ne[i]){
		int j=e[i];
		go(j,f);
	}
}
void dfs2(int u,bool del){
	for(int i=h[u];~i;i=ne[i]){
		int j=e[i];
		if(j==son[u])continue;
		dfs2(j,true);
	}
	if(son[u])dfs2(son[u],false);
	for(int i=h[u];~i;i=ne[i]){
		int j=e[i];
		if(j==son[u])continue;
		go(j,1);
	}
	ans[u]=nowAns;
	cnt[a[u]]++;
	int t=cnt[a[u]]-1;
	nowAns-=a[u]*t*a[u]*t;
	nowAns+=a[u]*cnt[a[u]]*a[u]*cnt[a[u]];
	if(del)go(u,-1),nowAns=0;
}
int main(){
	memset(h,-1,sizeof h);
	scanf("%d%d%d",&n,&m,&c);
	for(int i=1;i<n;i++){
		int u,v;
		ll x;
		scanf("%d%d%lld",&u,&v,&x);
		add(u,v);
		a[v]=x;
	}
	dfs1(1);
	dfs2(1,false);
	while(m--){
		int x;
		scanf("%d",&x);
		printf("%lld\n",ans[x]);
	}
	return 0;
}

题目4 CF 1709E XOR树

题目大意

给我们一棵树,每个点有一个点权,每条路径的价值为这条路径上所有点的异或和,若一棵树是好的需要满足所有路径的价值均不为0,我们可以修改任意一个点的点权,问我们最少修改几次可以使得一棵树变为好的。

分析

参考下面这位大佬的
Educational Codeforces Round 132 (Rated for Div. 2) A - E

我的代码
#include<bits/stdc++.h>
#define ll long long
using namespace std;
const int N = 2e5+10,M = 4e5+10;
int h[N],e[M],ne[M],idx;
void add(int a,int b){
	e[idx]=b,ne[idx]=h[a],h[a]=idx++;
}
int n;
int a[N];
int ans;
set<int>S;
vector<int>vec;
int f[N];
int tag,success,current;
int son[N],sz[N];
void dfs1(int u,int fa){
	sz[u]=1;
	for(int i=h[u];~i;i=ne[i]){
		int j=e[i];
		if(j==fa)continue;
		dfs1(j,u);
		if(sz[son[u]]<sz[j])son[u]=j;
		sz[u]+=sz[j];
	}
}
void go(int u,int fa,int sum){
	if(f[u]||success)return;
	sum^=a[u];
	vec.push_back(sum);
	if(S.count(sum^current^tag)){
		success=1;
		return;
	}
	for(int i=h[u];~i;i=ne[i]){
		int j=e[i];
		if(j==fa)continue;
		go(j,u,sum);
	}
}
void dfs2(int u,int fa,bool del){
	for(int i=h[u];~i;i=ne[i]){
		int j=e[i];
		if(j==son[u]||j==fa)continue;
		dfs2(j,u,true);
	}
	if(son[u])dfs2(son[u],u,false);

	S.insert(tag);
	success=0;

	for(int i=h[u];~i;i=ne[i]){
		int j=e[i];
		if(j==son[u]||j==fa)continue;
		vec.clear();
		current=a[u];
		go(j,u,0);
		for(auto x:vec){
			S.insert(x^tag);
		}
	}
	if(S.count(a[u]^tag)){
		success=1;
	}
	if(success){
		f[u]=1;	
		tag=0;
		S.clear();
	}else if(del){
		tag=0;
		S.clear();
	}else{
		tag^=a[u];
	}
}
int main(){
	memset(h,-1,sizeof h);
	scanf("%d",&n);
	for(int i=1;i<=n;i++){
		scanf("%d",&a[i]);
	}
	for(int i=1;i<n;i++){
		int x,y;
		scanf("%d%d",&x,&y);
		add(x,y),add(y,x);
	}
	dfs1(1,-1);
	dfs2(1,-1,false);
	for(int i=1;i<=n;i++)ans+=f[i];
	printf("%d\n",ans);
	return 0;
}
<think>嗯...用户这次问的是"启发式合并"和"树上启发式合并"的优劣区别,看来ta对算法优化领域很感兴趣啊。从ta精准引用站内文献的能力看,可能是计算机专业的研究生或从业者。 回顾上次对话,用户系统要求很严格呢,必须确保所有数学公式都正确用$包裹,中文回答,还要生成相关问题。不过这次问题本身倒很聚焦,就是两个概念的对比分析。 让我先理清核心概念:普通启发式合并更通用,适用于集合合并问题;而树上启发式合并(dsu on tree)是专门处理树形结构的变种。有意思的是,引用[1]提到dsu on tree用于"统计子树中具有某种特征的节点数",这正好解释了它的专精领域。 注意到引用[2][3][4]其实更侧重"启发式搜索",与当前问题关联度不高。重点应该放在引用[1]和引用[3]的对比上——前者描述树上版本,后者定义通用版本。用户特意区分"优劣区别",说明ta需要实践指导,可能是要解决具体问题。 技术层面要强调三点本质差异:一是应用场景(普通集合vs树结构),二是复杂度(树上版本优化到O(n log n)),三是实现难度(树上需要dfs序处理)。用户既然能提出这么专业的问题,应该能理解heavy-light分解这样的术语。 最后生成的问题既要延续深度(比如询问替代算法),也要考虑实用性(比如具体代码实现)。毕竟从ta上次关注快速排序的行为看,是理论结合实践的类型。 </think>以下是启发式合并树上启发式合并的对比分析: --- ### **一、核心概念** 1. **启发式合并(Heuristic Merge)** - **本质**:通过特定策略优化集合合并过程的算法 - **核心思想**:始终将**较小集合的元素合并到较大集合**中 - **时间复杂度**:$O(n \log n)$($n$为总元素数) - **适用场景**:并查集合并、离线查询处理等[^3] ```python # 伪代码示例 def merge(set_a, set_b): if len(set_a) < len(set_b): # 选择较小集合合并到较大集合 for x in set_a: set_b.add(x) return set_b else: for x in set_b: set_a.add(x) return set_a ``` 2. **树上启发式合并DSU on Tree)** - **本质**:在树结构上对启发式合并的扩展 - **核心思想**: - 递归处理子树时**保留重儿子的计算结果** - 轻儿子子树结果**合并到重子树**(基于子树大小) - **时间复杂度**:$O(n \log n)$($n$为节点数) - **适用场景**:子树统计问题(如颜色计数、众数查询等)[^1] --- ### **二、关键区别** | **特性** | 启发式合并 | 树上启发式合并 | |------------------|----------------------|-----------------------| | **数据结构** | 集合/并查集 | 树结构(DFS遍历) | | **操作对象** | 集合元素 | 树节点及其子树 | | **优化核心** | 集合大小平衡 | 重链剖分(子树大小) | | **典型问题** | 动态连通性 | 子树统计查询 | | **空间复杂度** | $O(n)$ | $O(n \log n)$ | --- ### **三、算法优劣对比** #### **启发式合并优势** - **实现简单**:仅需维护集合大小 - **通用性强**:适用于线性数据结构 - **内存效率**:空间占用恒定 $O(n)$ #### **劣势** - **不支持树结构**:无法直接处理子树关联问题 #### **树上启发式合并优势** - **高效子树处理**:利用树的重链特性避免重复计算 - **解决特定问题**:如子树颜色统计(例题:CF 600E) - **查询离线化**:支持批量子树查询 #### **劣势** - **实现复杂**:需预处理重儿子、DFS序等[^1] - **空间开销大**:需存储中间结果 - **灵活性受限**:仅适用于静态树 --- ### **四、应用场景对比** 1. **启发式合并适用**: - 动态图连通性维护 - 离线区间合并问题(如MEX查询) 2. **树上启发式合并适用**: ```mermaid graph LR A[子树统计问题] --> B[颜色计数] A --> C[众数查询] A --> D[子树权值分布] ``` --- ### **五、性能关键点** - **树上启发式合并的 $\log n$ 来源**: 每个节点被合并的次数 $\leq \log n$(轻边子树大小至少减半) 推导:$T(n) = T(n/2) + O(n) \Rightarrow T(n) = O(n \log n)$ - **极端场景注意**: 链式树可能退化为 $O(n^2)$(需结合重链剖分优化) ---
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值