CF600E Lomsat gelral（树上启发式合并）

最新推荐文章于 2024-06-28 16:13:59 发布

原创最新推荐文章于 2024-06-28 16:13:59 发布 · 537 阅读

0 ·

CC 4.0 BY-SA版权

启发式合并专栏收录该内容

1 篇文章

订阅专栏

本文介绍了一种解决树形结构问题的高效算法——树上启发式合并(dsudsu on tree)，通过保留重儿子结果并暴力迭代轻儿子，将复杂度优化至O(nlogn)。文章详细讲解了算法原理，包括重儿子概念、复杂度分析及代码实现。

题意

有一颗 $n$ 个节点的树，以 $1$ 为根节点，每个点有一个颜色 $v_i$ 。设子树 $a$ 中颜色出现次数最多的颜色集合为 ${b_i\}$ ，记 $ansa=∑bians_a=\sum b_i$ 。现在要求 $ans_1,ans_2,....ans_n$ 。
其中， $n,v≤105n,v\leq 10^5$ 。

分析

这种题叫做 $d s u o n t r e e$ ，也就是树上启发式合并。
让我们先考虑暴力做法。
就是以每个节点，对子树进行 $d f s$ ，然后开一个桶记录颜色出现次数，最后把颜色出现次数最多的颜色加起来。这样子做复杂度是 $O(n^2)$ 的。
这复杂度显然是不可接受的嘛！暴力差就差在，它计算了很多重复的东西！如果我们能让重复的东西尽量减少计算，复杂度就能够得到提升了！

看到这道题，有的同学可能一下子想的是树上莫队。
确实，莫队算法就是用来优化这些有重复计算的东西的。
不过，更优秀的算法是用启发式合并，复杂度可以做到 $O (n l o g n)$ 。
一句话解释这个算法，就是保留重儿子的结果，暴力迭代轻儿子。

重儿子是什么？
如果你学过树链剖分，就能一下子知道了。不过没学过也没关系。重儿子就是这个节点所有儿子中 $s i z$ 最大的点。如图：
在这里插入图片描述
$x$ 的 $s i z$ 最大，所以 $x$ 是 $r t$ 的重儿子。
记 $tot_i$ 为颜色 $i$ 的出现次数。
我们要让重复求的东西尽量少，但是子树之间又互相独立，于是我们只能钦点一个子树来保留 $t o t$ 的值。既然重儿子如此牛逼，那我们就钦点重儿子吧！
假设我们现在要求 $ans_{rt}$ ，我们已经保留了 $x$ 子树的 $t o t$ 数组。
那我们从 $r t$ 开始遍历一遍子树，如果遇到 $y, z$ ，就继续往下 $d f s$ ，求出 $t o t$ 。如果遇到 $x$ ，那么就可以 $r e t u r n$ 了，因为之前求过 $t o t$ 了。再求一遍不是智障了吗？？
这样子，单次求 $ans_rt$ 的复杂度是 $siz_{rt}-siz_{x}$ 的。
写成代码的话长这样：
在这里插入图片描述

关于复杂度

不妨考虑每个点会被访问多少次。
如果一个节点到根节点有 $x$ 条轻边，那么这个节点会被访问 $x$ 次。
由于一个节点到根节点的轻边数量不超过 $l o g n$ 条。
于是总的复杂度为 $O (n l o g n)$

后记

为什么这个叫树上启发式合并呢？其实，求解的过程可以看作是轻儿子不断往重儿子合并的过程，这和常规的启发式合并是一致的。从这个角度来看，复杂度也是 $O (n l o g n)$ 。

代码如下

#include <bits/stdc++.h>
#define N 100005
using namespace std;
typedef long long LL;
typedef unsigned long long uLL;
LL z = 1;
int read(){
	int x, f = 1;
	char ch;
	while(ch = getchar(), ch < '0' || ch > '9') if(ch == '-') f = -1;
	x = ch - '0';
	while(ch = getchar(), ch >= '0' && ch <= '9') x = x * 10 + ch - 48;
	return x * f;
}
struct node{
	int a, b, n;
}d[N * 2];
int fa[N], siz[N], son[N], h[N], v[N], cnt;
int tot[N], Son, maxn;
LL ans[N], sum;
void cr(int a, int b){
	d[++cnt].a = a; d[cnt].b = b; d[cnt].n = h[a]; h[a] = cnt;
}
void dfs1(int a){
	int i, b;
	siz[a] = 1;
	for(i = h[a]; i; i = d[i].n){
		b = d[i].b;
		if(b == fa[a]) continue;
		fa[b] = a;
		dfs1(b);
		siz[a] += siz[b];
		if(siz[b] >= siz[son[a]]) son[a] = b;//找到重儿子 
	}
}
void add(int a, int c){//遍历 a 的子树，求出 ans[a] 
	int i, b;
	tot[v[a]] += c;//更新 tot 数组 
	if(maxn < tot[v[a]]) maxn = tot[v[a]], sum = v[a];
	else if(maxn == tot[v[a]]) sum += v[a];//这一步是在更新 sum 和 maxn
	for(i = h[a]; i; i = d[i].n){
		b = d[i].b;
		if(b == fa[a] || b == Son) continue;//遇到重儿子就return，所以只遍历轻儿子 
		add(b, c);
	}
}
void dsu(int a, int flag){
	int i, b;
	for(i = h[a]; i; i = d[i].n){
		b = d[i].b;
		if(b != fa[a] && b != son[a]) dsu(b, 1);//先求轻儿子 
	}
	if(son[a]) dsu(son[a], 0), Son = son[a]; //再求重儿子 
	add(a, 1); Son = 0; ans[a] = sum;//求出 ans[a]，同时把重儿子标记去除（没去除的话无法清空 tot 数组 
	if(flag) add(a, -1), sum = 0, maxn = 0;//如果当前节点是轻儿子，就清空 tot 数组并且重置 sum 和 maxn 
}
int main(){
	int i, j, n, m, a, b;
	n = read();
	for(i = 1; i <= n; i++) v[i] = read();
	for(i = 1; i < n; i++){
		a = read(); b = read();
		cr(a, b); cr(b, a);
	}
	dfs1(1);
	dsu(1, 0);
	for(i = 1; i <= n; i++) printf("%lld ", ans[i]);
	return 0;
}