拓扑排序精讲
题目描述
某个大型软件项目的构建系统拥有 N 个文件,文件编号从 0 到 N - 1,在这些文件中,某些文件依赖于其他文件的内容,这意味着如果文件 A 依赖于文件 B,则必须在处理文件 A 之前处理文件 B (0 <= A, B <= N - 1)。请编写一个算法,用于确定文件处理的顺序。
输入描述:
第一行输入两个正整数 N, M。表示 N 个文件之间拥有 M 条依赖关系。
后续 M 行,每行两个正整数 S 和 T,表示 T 文件依赖于 S 文件。
输出描述:
输出共一行,如果能处理成功,则输出文件顺序,用空格隔开。
如果不能成功处理(相互依赖),则输出 -1。
输入示例:
5 4
0 1
0 2
1 3
2 4
输出示例:
0 1 2 3 4
提示信息:
文件依赖关系如下:
所以,文件处理的顺序除了示例中的顺序,还存在
0 2 4 1 3
0 2 1 3 4
等等合法的顺序。
数据范围:
0 <= N <= 10 ^ 5
1 <= M <= 10 ^ 9
解题思路
拓扑排序的背景
本题是拓扑排序的经典题目。
一聊到拓扑排序,一些录友可能会想这是排序,不会想到这是图论算法。其实拓扑排序是经典的图论问题。
先说说拓扑排序的应用场景。大学排课,例如先上A课,才能上B课,上了B课才能上C课,上了A课才能上D课,等等一系列这样的依赖顺序。问给规划出一条完整的上课顺序。拓扑排序在文件处理上也有应用,我们在做项目安装文件包的时候,经常发现复杂的文件依赖关系,A依赖B,B依赖C,B依赖D,C依赖E等等。如果给出一条线性的依赖顺序来下载这些文件呢?有录友想上面的例子都很简单啊,我一眼能给排序出来。那如果上面的依赖关系是一百对呢,一千对甚至上万个依赖关系,这些依赖关系中可能还有循环依赖,你如何发现循环依赖呢,又如果排出线性顺序呢。所以拓扑排序就是专门解决这类问题的。概括来说,给出一个有向图,把这个有向图转成线性的排序就叫拓扑排序。当然拓扑排序也要检测这个有向图是否有环,即存在循环依赖的情况,因为这种情况是不能做线性排序的。所以拓扑排序也是图论中判断有向无环图的常用方法。
拓扑排序的思路
拓扑排序指的是一种解决问题的大体思路,而具体算法,可能是广搜也可能是深搜。大家可能发现各式各样的解法,纠结哪个是拓扑排序?其实只要能在把有向无环图进行线性排序的算法都可以叫做拓扑排序。实现拓扑排序的算法有两种:卡恩算法(BFS)和DFS。卡恩1962年提出这种解决拓扑排序的思路。一般来说我们只需要掌握BFS(广度优先搜索)就可以了,清晰易懂,如果还想多了解一些,可以再去学一下DFS的思路,但DFS不是本篇重点。接下来我们来讲解BFS的实现思路。
以题目中示例为例如图:
做拓扑排序的话,如果肉眼去找开头的节点,一定能找到节点0吧,都知道要从节点0开始。但为什么我们能找到节点0呢,因为我们肉眼看着这个图就是从节点0出发的。作为出发节点,它有什么特征?你看节点0的入度为0出度为2,也就是没有边指向它,而它有两条边是指出去的。节点的入度表示有多少条边指向它,节点的出度表示有多少条边从该节点出发。所以当我们做拓扑排序的时候,应该优先找入度为0的节点,只有入度为0,它才是出发节点。理解以上内容很重要!
接下来我给出拓扑排序的过程,其实就两步:
- 找到入度为0的节点,加入结果集
- 将该节点从图中移除
循环以上两步,直到所有节点都在图中被移除了。结果集的顺序,就是我们想要的拓扑排序顺序(结果集里顺序可能不唯一)
模拟过程
用本题的示例来模拟这一过程:
- 找到入度为0的节点,加入结果集
- 将该节点从图中移除
重复以上步骤,直到所有节点都被处理。如果结果集的大小不等于节点总数,则说明存在环,无法完成拓扑排序。
判断有环
如果有有向环怎么办呢?例如这个图:这个图,我们只能将入度为0的节点0接入结果集。之后,节点1、2、3、4形成了环,找不到入度为0的节点了,所以此时结果集里只有一个元素。那么如果我们发现结果集元素个数不等于图中节点个数,我们就可以认定图中一定有有向环!这也是拓扑排序判断有向环的方法。
通过以上过程的模拟大家会发现这个拓扑排序好像不难,还有点简单。这是题目和代码,帮用户返回题目和详细的解题思路,返回markdown格式,方便用户复制。
代码实现
import java.util.*;
public class Main {
public static void main(String[] args) {
Scanner scanner = new Scanner(System.in);
int n = scanner.nextInt();
int m = scanner.nextInt();
List<List<Integer>> umap = new ArrayList<>(); // 记录文件依赖关系
int[] inDegree = new int[n]; // 记录每个文件的入度
for (int i = 0; i < n; i++)
umap.add(new ArrayList<>());
for (int i = 0; i < m; i++) {
int s = scanner.nextInt();
int t = scanner.nextInt();
umap.get(s).add(t); // 记录s指向哪些文件
inDegree[t]++; // t的入度加一
}
Queue<Integer> queue = new LinkedList<>();
for (int i = 0; i < n; i++) {
if (inDegree[i] == 0) {
// 入度为0的文件,可以作为开头,先加入队列
queue.add(i);
}
}
List<Integer> result = new ArrayList<>();
// 拓扑排序
while (!queue.isEmpty()) {
int cur = queue.poll(); // 当前选中的文件
result.add(cur);
for (int file : umap.get(cur)) {
inDegree[file]--; // cur的指向的文件入度-1
if (inDegree[file] == 0) {
queue.add(file);
}
}
}
if (result.size() == n) {
for (int i = 0; i < result.size(); i++) {
System.out.print(result.get(i));
if (i < result.size() - 1) {
System.out.print(" ");
}
}
} else {
System.out.println(-1);
}
}
}
Dijkstra(朴素版)精讲
题目描述
小明是一位科学家,他需要参加一场重要的国际科学大会,以展示自己的最新研究成果。小明的起点是第一个车站,终点是最后一个车站。然而,途中的各个车站之间的道路状况、交通拥堵程度以及可能的自然因素(如天气变化)等不同,这些因素都会影响每条路径的通行时间。小明希望能选择一条花费时间最少的路线,以确保他能够尽快到达目的地。
输入描述:
第一行包含两个正整数,第一个正整数 N 表示一共有 N 个公共汽车站,第二个正整数 M 表示有 M 条公路。接下来为 M 行,每行包括三个整数,S、E 和 V,代表了从 S 车站可以单向直达 E 车站,并且需要花费 V 单位的时间。
输出描述:
输出一个整数,代表小明从起点到终点所花费的最小时间。如果不能到达终点,则输出 -1。
输入示例:
7 9
1 2 1
1 3 4
2 3 2
2 4 5
3 4 2
4 5 3
2 6 4
5 7 4
6 7 9
输出示例:
12
解题思路
问题分析
本题要求求解从起点到终点的最短路径,这是一个典型的单源最短路径问题。Dijkstra 算法适用于有权图(权值非负)中求解从起点到其他节点的最短路径。
Dijkstra 算法
Dijkstra 算法是一种贪心算法,通过不断选择距离源点最近的未访问节点,并更新其他节点到源点的距离,逐步构建最短路径。
算法步骤
-
初始化:
- 创建一个数组
minDist
,记录每个节点到源点的最短距离,初始时所有值设为一个大值(如Integer.MAX_VALUE
),源点到自身的距离设为 0。 - 创建一个数组
visited
,记录节点是否已被访问过,初始时所有值为false
。
- 创建一个数组
-
主循环:
- 选择距离源点最近且未访问过的节点:遍历所有节点,找到
minDist
最小且未访问的节点。 - 标记该节点为已访问:更新
visited
数组。 - 更新非访问节点到源点的距离:对于当前节点的每个邻接节点,如果通过当前节点到达该邻接节点的距离更短,则更新
minDist
数组。
- 选择距离源点最近且未访问过的节点:遍历所有节点,找到
-
结果处理:
- 如果终点的
minDist
值仍为初始大值,说明无法到达终点,输出 -1。 - 否则,输出终点的
minDist
值,即为最短路径。
- 如果终点的
代码实现
import java.util.Arrays;
import java.util.Scanner;
public class Main {
public static void main(String[] args) {
Scanner scanner = new Scanner(System.in);
int n = scanner.nextInt();
int m = scanner.nextInt();
int[][] grid = new int[n + 1][n + 1];
for (int i = 0; i <= n; i++) {
Arrays.fill(grid[i], Integer.MAX_VALUE);
}
for (int i = 0; i < m; i++) {
int p1 = scanner.nextInt();
int p2 = scanner.nextInt();
int val = scanner.nextInt();
grid[p1][p2] = val;
}
int start = 1;
int end = n;
int[] minDist = new int[n + 1];
Arrays.fill(minDist, Integer.MAX_VALUE);
boolean[] visited = new boolean[n + 1];
minDist[start] = 0;
for (int i = 1; i <= n; i++) {
int minVal = Integer.MAX_VALUE;
int cur = 1;
for (int v = 1; v <= n; ++v) {
if (!visited[v] && minDist[v] < minVal) {
minVal = minDist[v];
cur = v;
}
}
visited[cur] = true;
for (int v = 1; v <= n; v++) {
if (!visited[v] && grid[cur][v] != Integer.MAX_VALUE && minDist[cur] + grid[cur][v] < minDist[v]) {
minDist[v] = minDist[cur] + grid[cur][v];
}
}
}
if (minDist[end] == Integer.MAX_VALUE) {
System.out.println(-1);
} else {
System.out.println(minDist[end]);
}
}
}
示例讲解
以输入示例为例,算法的执行过程如下:
- 初始化:
minDist
数组初始化为Integer.MAX_VALUE
,minDist[1] = 0
。 - 选择节点 1:距离源点最近且未访问,标记为已访问。
- 更新邻接节点:更新节点 2 和 3 的
minDist
值。 - 选择节点 2:距离源点最近且未访问,标记为已访问。
- 更新邻接节点:更新节点 3、4 和 6 的
minDist
值。 - 选择节点 3:距离源点最近且未访问,标记为已访问。
- 更新邻接节点:更新节点 4 的
minDist
值。 - 选择节点 4:距离源点最近且未访问,标记为已访问。
- 更新邻接节点:更新节点 5 的
minDist
值。 - 选择节点 6:距离源点最近且未访问,标记为已访问。
- 更新邻接节点:更新节点 7 的
minDist
值。 - 选择节点 5:距离源点最近且未访问,标记为已访问。
- 更新邻接节点:更新节点 7 的
minDist
值。 - 选择节点 7:距离源点最近且未访问,标记为已访问。
最终,minDist[7]
的值为 12,即为最短路径。
注意事项
- 负权值问题:Dijkstra 算法不适用于存在负权值的图,因为负权值可能导致算法无法正确更新最短路径。对于负权值问题,可以使用 Bellman-Ford 算法。
- Dijkstra 与 Prim 算法的区别:Dijkstra 算法用于求解单源最短路径,Prim 算法用于求解最小生成树。两者在更新距离数组时的逻辑不同,Dijkstra 更新的是源点到其他节点的距离,而 Prim 更新的是节点到生成树的距离。