8月6号图论经典：dijkstra算法和证明-优快云博客

本文链接：https://blog.youkuaiyun.com/weixin_40857308/article/details/119871236

dijkstra算法练习：https://www.geeksforgeeks.org/dijkstras-shortest-path-algorithm-greedy-algo-7/

详见8月6号的jupyter notebook

然后是dijkstra合理性的证明，使用反证法，详见ipad.

以下介绍性的内容出自知乎专栏：https://zhuanlan.zhihu.com/p/129373740

Dijkstra 算法，是由荷兰计算机科学家 Edsger Wybe Dijkstra 在1956年发现的算法，戴克斯特拉算法使用类似广度优先搜索的方法解决赋权图的单源最短路径问题。Dijkstra 算法原始版本仅适用于找到两个顶点之间的最短路径，后来更常见的变体固定了一个顶点作为源结点然后找到该顶点到图中所有其它结点的最短路径，产生一个最短路径树。本算法每次取出未访问结点中距离最小的，用该结点更新其他结点的距离。需要注意的是绝大多数的Dijkstra 算法不能有效处理带有负权边的图。

下面，我们就从一个赋权的有向图为例开始解释Dijkstra 算法。

设一个赋权有向图 [公式] 。其中的每条边的权值为一个非负的实数，该权值表示从顶点到顶点的距离。并设一单源点。现在我们的任务是：找出从源点出发，到中所有的节点的最短路径。

我们来看一个具体的例子：

这是一个具有 [公式] 个顶点的赋权有向图，其顶点集合为，其权值分别为：

现在我们选定 [公式] 为原点：

则从源点 [公式] 出发，到中所有顶点的最短路径分别为：

即：

其中， [公式] 表示从源点出发，到中的顶点的最短路径。

注：最短路径可以理解为所有可能的路径中总权和最小的那一条路径。举一个再简单不过的例子：你开车从城市到城市，假设有很多条路可以走，最短的那条路就是最短路径，总权和可以理解为总的公里数。

以上是我们通过观察和计算比对出来的最短路径，下面我们就来看看Dijkstra 算法是如何帮助我们找到这些所有的最短路径的。

在开始之前，有几个概念需要明确一下。

定义一个集合，如果集合中的某个顶点在集合中了，那么就说明从源点到顶点的最短路径已经被找到，而在算法一开始的时候，集合中只有源点。即：

而且，当且仅当 [公式] 的时候算法执行完毕。此时顶点集中的所有元素都被放进了集合种，也就是说除了源点以外的所有从源点出发到其余所有顶点的最短路径已被找到。

注：当然了，你也可以认为源点到自己本身的最短路径也被找到了。对于任意一个无自环的源点，它到自己本身的最短路径都是。

下面这个概念可能稍微有些抽象，不过没有关系，这里理解不了的话我们一会讲例子的时候会进行具体说明。这个概念叫做从源点到顶点 (一开始 )的相对于集合的最短路径。即从源点到顶点的路径中间只能经过已经包含在集合中的顶点，而不能经过其余的还未在集合中的顶点。而这个相对于集合的最短路径的长度我们记作：

而我们之前的 [公式] 表示的是全局的从源点到顶点的最短路径，这个最短路径没有限制“必须在路径中间只能经过已经包含在集合中的顶点”，这个全局的最短路径才是我们要的最终解。所以，一般有关系：

而我们的Dijkstra 算法要做的就是通过不断计算 [公式] 进而不断的扩充集合，当集合不断被扩充的时候，相对于集合的最短路径会越来越短，直到入集合之时，此时我们便得到了，且此时有。下面我们来看看算法的设计思想：

输入：赋权有向图。输出：从源点到所有的的最短路径。初始；对于，计算；选择，并将这个放进集合中，更新中的顶点的值；重复，直到。

然后是Dijkstra 算法的伪码：

下面我们来解释一下这个伪码：

[公式] 算法初始，将选择的源点放进集合中；

[公式] 无自环的源点到自己的最短路径为；

[公式] 当顶点不在集合中时(此时集合中仍只有源点 )，开始进入循环；

[公式] 将源点与点之间的权值赋给。由于是有向图，所以当源点不指向任何其他集合外的顶点时，。可以理解为此时从源点出发，暂时是达到不了的。不过后来随着集合的扩充，从源点出发一定能到达所有的顶点。一会我们讲解例子时会出现这种情况。此时第一个 [公式] 循环结束。

[公式] 如果集合不是空集，则进入循环；

[公式] 选出经过第一个循环之后的，在集合中的，且相对于集合的最短路径中距离最短的那个顶点 ;

[公式] 将这个顶点并入集合，从而达到扩充集合的目的；

[公式] 将顶点并入集合之后可能会对其他顶点相对于集合的最短路的长度会有影响，所以进入内循环对有影响的进行更新；

[公式] 即如果从源点到我们在第步选出的顶点的相对于集合的最短路径的长度再加上顶点到顶点之间的距离还要小于源点到顶点的相对于集合的最短路径的长度还要短的话；

[公式] 则将源点到顶点的相对于集合的最短路径更新成源点到我们在第步选出的顶点的相对于集合的最短路径再加上顶点到顶点之间的权值。

下面我们开始讲例子，我们还是以图片1中的赋权有向图进行说明。

首先我们还是选择 [公式] 为原点，那么在算法的开始，。之后我们计算除了以外的其余顶点到的距离，即寻找所有的除了以外的所有顶点相对于集合的最短路，即从出发，到达所有顶点且只允许通过顶点 (因为此时集合中只有 [公式] 这一个元素)的最短路径。这是我们的算法中的第一个循环在做的事情。这时候我们发现想要只通过顶点而到达顶点都是不可能的，所以我们有：

而 [公式] 就是算法中所说的暂时到达不了的顶点了。现在算法的前四步已经结束了，现在开始第五步检验集合是否是空集，这里显然不是，这里：

现在进行第六步。第六步是选出经过第一个 [公式] 循环之后的，在集合中的，且相对于集合的最短路径中距离最短的那个顶点。那我们看看在式中那个顶点距离源点最短就好了，显然是，所以，我们这里选择的。

那么第七步就是将 [公式] 放进集合中了。此时集合。这就是说明从源点出发，到顶点的最短路径已经被找到了。

下面我用绿色表示被放入集合 [公式] 中的顶点：

[公式] 的颜色我就不变了，因为它一直都在集合中。此时：

这就说明下次在找相对于集合 [公式] 的最短路径的时候中就有两个点可以被通过了，这样也许就会使得一些原来到达不了的顶点由于可以多经过一个点而到达，这也就是算法中所说的当我将一个新的顶点并入集合之后，其他的在集合以外的顶点的相对于集合 [公式] 的最短路径的长度可能会发生改变，因为有些原来暂时到达不了的顶点现在可以到达了。具体的来讲，我们有：

这个更新步骤我也来详细是说一下，这是算法第八到第十步所做的事情。比如 [公式] ，一开始在集合中只有源点，而找到相对于集合的最短路径只能通过顶点，这样我们在式中所得到。但是当顶点也进入到集合之后我们再找相对于集合的最短路径时就可以先通过顶点然后到顶点 [公式] ，最后再到。现在这两种走法都可以，但是算法究竟选择哪种算法还是要判断哪种走法距离最短，即比较：