算法学习笔记() DFS序、树链剖分及其应用

最新推荐文章于 2022-05-21 19:20:08 发布

原创

最新推荐文章于 2022-05-21 19:20:08 发布 · 495 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#深度优先 #算法 #数据结构

本文深入探讨了树链剖分的概念和实现，包括重链剖分的原理、时间戳的性质以及如何利用线段树解决树结构中的常见操作。文章通过实例详细解析了树链剖分的过程，并提供了模板问题的解决方案，同时讨论了树链剖分在求解最短路径和最近公共祖先等问题中的应用。

本文属于「算法学习」系列文章之一。之前的「数据结构和算法设计」系列着重于基础的数据结构和算法设计课程的学习，与之不同的是，这一系列主要用来记录大学课程范围之外的高级算法学习、优化与应用的全过程，同时也将归纳总结出简洁明了的算法模板，以便记忆和运用。在本系列学习文章中，为了透彻理解算法和代码，本人参考了诸多博客、教程、文档、书籍等资料，由于精力有限，恕不能一一列出，这里只列示重要资料的不完全参考列表：

算法竞赛进阶指南，李煜东著，河南电子音像出版社，GitHub Tedukuri社区以及个人题解文章汇总目录

算法第四版 Algorithm Fourth Edition，[美] Robert Sedgewick, Kevin Wayne 著，谢路云译，配套网站

为了方便在PC上运行调试、分享代码，我还建立了相关的仓库。在这一仓库中，你可以看到算法文章、模板代码、应用题目等等。由于本系列文章的内容随时可能发生更新变动，欢迎关注和收藏算法学习系列文章目录一文以作备忘。

1. 模板问题

先把树链剖分的模板题给出来——已知一棵树，每个结点上包含一个数值，需要设法实现以下操作：

操作1：格式 1 x y z ，表示将树从 x 到 y 结点的最短路径之上，所有结点的值都加上 z ；
操作2：格式 2 x y ，表示求树中 x 到 y 结点的最短路径之上，所有结点的值之和；
操作3：格式 3 x z ，表示将以 x 为根结点的子树内，所有结点值都加上 z ；
操作4：格式 4 x ，表示求以 x 为根结点的子树内，所有结点值之和

这一模板题的具体要求见P3384 【模板】轻重链剖分/树链剖分，本人的题解与代码见这篇文章，完整实现了线段树和树链剖分。

2. DFS序和时间戳

顾名思义，DFS序就是（此处是先根遍历）DFS的顺序。先来个例子，DFS遍历下图的子树，得到的DFS序是 A B D G H I C E J F：

不要把欧拉序和DFS搞混了，欧拉序是：A B D G D H D I D B A C E J E C F C A ，即访问到该结点算一次、返回到该结点算一次。

时间戳就是（此处是先根遍历）DFS第一次访问到每个结点时的“时间”，这一时间是一个从 $1$ 开始递增的整数。仍以上图为例，分别标出结点对应的时间戳：

DFS序+时间戳的用处在于，它使树具有连续性，使树转变为一个“连续的序列”——我们把树看作数组，时间戳是下标，结点的值分别存储在其时间戳对应的位置。在上图中，“数组”是 arr ，于是 arr[1] = 'A', arr[2] = 'B', arr[3] = 'D', arr[4] = 'G', arr[5] = 'H', arr[6] = 'I', arr[7] = 'C', arr[8] = 'E', arr[9] = 'J', arr[10] = 'F' 。

从示例中，我们可以发现两个重要的性质：

一个结点的子树上的结点的时间戳，一定大于结点，且按照DFS序连续。例如，结点 C 的子树 E, J, F 的时间戳为 8, 9, 10 。
某些链（或者说路）上的时间戳也是连续的。例如，A, B, D, G 这条链上的时间戳是连续的，C, E, J 这条链上的时间戳也是连续的。

这样一来，我们可以套一个线段树，用线段树的区间修改和区间查询实现操作3和操作4。只是操作1和操作2呢？并不是所有的链都有连续的时间戳——像 A -> B -> D -> G 这条链也可用线段树的区间修改和查询来操作，但像 A -> C -> E -> J 就完全不可行了。这时，我们就需要树链剖分大法了！