动态规划：从入门到精通的思维导图

原创

已于 2025-05-20 14:16:42 修改 · 989 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#动态规划 #算法

于 2025-05-20 03:01:49 首次发布

动态规划：从入门到精通的思维导图

动态规划（Dynamic Programming, DP）是一种在数学、计算机科学和经济学中使用的，通过将复杂问题分解为更小、更简单的子问题来简化复杂问题求解的方法。它不仅仅是一套固定的算法，更是一种解决问题的思想和方法论。本教程旨在帮助学习者彻底理解动态规划的核心思想，掌握其应用方法，从而能够灵活应对各类问题，而非仅仅停留在死记硬背具体题解的层面。

第一章：初识动态规划

动态规划并非某种特定的编程语言或工具，而是一种解决问题的策略。理解其基本定义、核心思想以及发展历史，是迈向动态规划的第一步。

1.1 什么是动态规划？

动态规划是一种将复杂问题转化为一系列更简单子问题的优化方法；其本质特征是优化过程的多阶段性。它将一个看似庞大到无法解决的问题，分解成一系列可管理的、相互依赖的较小部分。在计算机编程中，动态规划通过分解复杂问题，保存子问题的解，并利用这些解来优化整体解决方案，通常用于寻找给定查询的最优值（最大或最小值）。

这个概念由理查德·贝尔曼（Richard Bellman）在20世纪40年代提出并推广。他最初使用这个术语是为了描述那些一个问题部分的解依赖于另一部分解的问题。有趣的是，贝尔曼选择“动态规划”这个名字，部分原因是为了掩盖他正在进行数学研究的事实，因为他当时工作的兰德公司，其国防部长对“研究”一词持有病态的恐惧和厌恶。贝尔曼希望这个术语听起来足够积极且难以被贬低。

1.2 核心思想：分解与记忆

动态规划的核心在于“分而治之”与“记忆化”。它将一个大问题分解为若干个规模较小的子问题，然后逐个解决这些子问题，并把子问题的解存储起来，以便在后续需要时直接使用，避免重复计算。这个过程可以被视为一种“聪明的蛮力法”或“细致的暴力搜索”。通过这种方式，原本可能需要指数级时间才能解决的问题，往往可以在多项式时间内得到解答。

具体来说，动态规划的运作方式与带有中间解记忆的递归（也称为记忆化搜索）非常相似。递归算法倾向于将大问题划分为较小的子任务并解决它们。动态规划算法则将问题分解成若干部分，并逐一计算，逐步构建解决方案。因此，动态规划可以被看作是自底向上的递归。

1.3 动态规划的优势

动态规划作为一种强大的算法设计技巧，尤其擅长解决优化问题，例如寻找最短路径或最大收益等。其主要优势包括：

速度：通过避免重复计算，动态规划能显著提高算法效率，使得一些原本难以解决的问题（通常具有指数级复杂度）能够在多项式时间内（例如平方时间）得到解决。
普适性：动态规划提供了一种系统性的方法来填充决策表或状态数组，从而保证在任何数据上都能找到问题的解，几乎没有例外和边界情况的困扰。
准确性：由于其系统性的构建过程，动态规划能够精确地找到最优解。

第二章：动态规划的基石

动态规划并非万能钥匙，它的适用性依赖于问题本身是否具备两个关键特性：最优子结构（Optimal Substructure）和重叠子问题（Overlapping Subproblems）。理解这两个概念是判断一个问题能否使用动态规划以及如何设计动态规划算法的基础。

2.1 最优子结构

定义：如果一个问题的最优解可以由其子问题的最优解构造而成，那么称该问题具有最优子结构。这意味着，如果我们将原问题分解为若干子问题，并且我们能够找到这些子问题的最优解，那么将这些子问题的最优解组合起来，就能得到原问题的最优解。

生活中的类比：

最短路径：假设从西雅图到洛杉矶的最短路径经过波特兰，然后是萨克拉门托。那么，从波特兰到洛杉矶的最短路径也必须经过萨克拉门托。子问题（从波特兰到洛杉矶的最短路径）的最优解是构成原问题（从西雅图到洛杉矶的最短路径）最优解的一部分。
制作三明治：如果制作一个美味三明治（最优解）的秘诀在于每一层配料（子问题）都完美搭配，那么完美的三明治一定是由完美搭配的每一层构成的。
搭乐高城堡：如果城堡的每一个部分都搭建得非常完美（子问题的最优解），那么整个城堡也会是一件杰作（原问题的最优解）。

重要性：最优子结构是动态规划和贪心算法能够使用的前提。如果一个问题不具备最优子结构，那么即使解决了所有子问题，也无法保证能得到原问题的最优解。例如，查询最便宜的机票问题。从机场A到机场B的最便宜航班可能需要在机场C中转，但从机场A到机场C的最便宜航班可能涉及到其他中转机场D，而不是直接构成A到B最便宜航班的一部分，因为航空公司售卖多程机票的价格通常不是各段航班价格的简单加总。

2.2 重叠子问题

定义：如果在解决一个问题的过程中，其子问题被反复多次求解，那么称该问题具有重叠子问题特性。递归算法在解决此类问题时，会不断地解决相同的子问题，而不是总生成新的子问题。

生活中的类比：

计算斐波那契数列：计算斐波那契数 $F (n)$ 的公式是 $F (n) = F (n - 1) + F (n - 2)$ 。若要计算 $F (5)$ ，需要计算 $F (4)$ 和 $F (3)$ 。计算 $F (4)$ 又需要计算 $F (3)$ 和 $F (2)$ 。可以看到， $F (3)$ 被计算了两次， $F (2)$ 也被多次计算。这种对相同子问题的重复计算就是重叠子问题的体现。
爬楼梯：假设要爬到第 $n$ 级楼梯，每次可以爬1级或2级。到达第 $n$ 级楼梯的方法数，依赖于到达第 $n - 1$ 级和第 $n - 2$ 级楼梯的方法数。在计算过程中，到达某个中间级（比如第3级）的方法数可能会被多次重复用到。

重要性：动态规划正是利用了重叠子问题的特性，通过将子问题的解存储起来（通常使用表格或记忆化数组），在下次需要求解同一子问题时直接查表获取结果，从而避免了大量的重复计算，极大地提高了效率。如果子问题不重叠，那么分治法可能是更合适的选择。

这两个特性——最优子结构和重叠子问题——是判断一个问题是否适合使用动态规划的关键。最优子结构保证了我们可以通过组合子问题的最优解来得到原问题的最优解；而重叠子问题则说明了存储子问题解的必要性和有效性。只有当问题同时具备这两个特性时，动态规划才能发挥其威力。

第三章：动态规划的实现策略：记忆化与递推

一旦确定问题适合使用动态规划，就需要选择具体的实现策略。主要有两种方法：记忆化（Memoization，通常对应自顶向下的递归实现）和递推（Tabulation，通常对应自底向上的迭代实现）。

3.1 记忆化搜索 (Memoization - Top-Down)

记忆化搜索是一种自顶向下的动态规划实现方式。它从原问题开始，通过递归的方式将问题分解为子问题。当一个子问题首次被求解时，其解会被存储在一个“备忘录”（通常是数组或哈希表）中。如果后续再次遇到相同的子问题，则直接从备忘录中读取解，而不是重新计算。

思路特点：

递归驱动：保持了递归的自然结构，从大问题出发，逐步分解到小问题。
按需计算：只计算那些在求解原问题过程中确实遇到的子问题。如果某些子问题空间中的子问题根本不需要被解决，记忆化方法具有只解决那些确实需要的子问题的优势。

代码实现特点：

通常是一个递归函数，函数参数代表子问题的状态。
在递归函数开始时，检查备忘录中是否已存在当前状态的解。
如果存在，直接返回；否则，进行计算，并将结果存入备忘录后再返回。

优点：

实现直观：对于具有自然递归结构的问题，记忆化更容易实现，代码通常更接近问题的数学定义。
只解必需的子问题：在子问题空间稀疏（即并非所有子问题都需要求解）的情况下，效率较高。

缺点：

递归开销：函数调用的开销可能较大，尤其是在递归深度很深时。
栈溢出风险：深度递归可能导致调用栈溢出。

3.2 递推 (Tabulation - Bottom-Up)

递推是一种自底向上的动态规划实现方式。它首先确定子问题的求解顺序，通常是从最小的子问题开始，逐步迭代计算并填充一个DP表（通常是一维或多维数组），直到计算出原问题的解。

思路特点：

迭代驱动：通过循环迭代，从基础解开始，一步步构建出更复杂问题的解。
系统计算：通常会计算所有可能相关的子问题的解，并填满DP表。

代码实现特点：

通常使用循环结构（如 for 循环）来遍历状态。
DP表（数组）用于存储子问题的解。
表项的填充顺序经过精心设计，确保在计算某个状态 $d p [i]$ 时，其所依赖的子问题 $d p [j]$ (其中 $j$ 通常小于 $i$ 或在某种拓扑序上先于 $i$ ) 已经计算完毕。

优点：

无递归开销：避免了函数调用的开销，通常速度更快。
无栈溢出风险：迭代实现不存在栈溢出问题。
空间优化可能性：有时可以根据状态转移的依赖关系优化DP表的空间，例如使用“滚动数组”技巧，将空间复杂度从 $O (N)$ 降至 $O (1)$ （如斐波那契数列）。
缓存友好：系统性的内存访问模式可能带来更好的缓存性能。

缺点：

实现可能稍复杂：需要明确定义状态的计算顺序，有时不如递归直观。
计算所有子问题：即使某些子问题对最终解没有贡献，它们也可能被计算，这在子问题空间稀疏时可能造成浪费。

3.3 记忆化 vs. 递推：如何选择？

特性	记忆化 (自顶向下)	递推 (自底向上)
核心思路	递归分解，按需计算	迭代构建，系统计算
实现方式	递归函数 + 备忘录 (如哈希表、数组)	循环 + DP表 (如数组、矩阵)
子问题求解	只求解求解过程中遇到的子问题	通常求解所有相关子问题
代码直观性	对于自然递归的问题，代码可能更直观，易于思考状态转移	状态转移关系有时较难思考，代码在条件多时可能变复杂
执行效率	可能有递归调用开销，较慢	无递归开销，通常较快
栈空间	可能因递归过深导致栈溢出	无栈溢出风险
适用场景	子问题依赖关系复杂或不清晰时；子问题空间稀疏时	子问题依赖关系清晰，所有子问题都需要求解时；对性能要求高时

记忆化可以看作是在朴素递归的基础上增加了一个缓存机制，而递推则是从最简单的情况出发，一步步搭建出最终的解。在实际应用中，如果一个问题的递归形式非常自然，那么记忆化通常是更容易想到的起点。如果所有子问题都必须至少解决一次，那么自底向上的动态规划算法通常会比自顶向下的记忆化算法快一个常数因子。选择哪种方法取决于问题的具体结构、对时空效率的要求以及个人偏好。有时，从记忆化版本开始，理解了状态和转移后，再将其转化为递推版本会更容易。

第四章：动态规划解题通用框架

虽然动态规划问题千变万化，但解决它们通常遵循一个相对固定的思考框架。掌握这个框架有助于系统地分析问题，并最终找到解决方案。

步骤 1：判断问题是否适用动态规划
首先要确定问题是否能用动态规划解决。关键在于问题是否能分解为更小的子问题，并且满足最优子结构和重叠子问题的特性。通常，要求解最大/最小值，或者统计方案数量的问题，可能是动态规划问题。

步骤 2：识别变量，定义状态 (State)
这是动态规划中最核心也往往是最难的一步。状态是用来描述子问题的。需要找出在子问题演化过程中哪些参数是变化的，这些变化的参数共同构成了状态。
例如，在斐波那契数列问题中，状态是 $n$ ，即第 $n$ 个数。在爬楼梯问题中，状态是当前所在的楼梯级数。在0/1背包问题中，状态可能包括当前考虑到的物品索引和背包剩余容量。
定义状态的关键在于，状态必须包含足够的信息来唯一确定一个子问题，并且能够通过这个状态推导出该子问题的解。一个好的状态定义应该具有“无后效性”，即一旦某个状态的值确定了，它就不会再被后续的决策所改变，未来的决策只依赖于当前状态，而与如何达到这个状态无关。

步骤 3：定义状态转移方程 (Recurrence Relation)
状态转移方程（也称递推关系）描述了不同状态之间的关系，即如何从一个或多个已知解的子问题（较小状态）推导出当前问题（较大状态）的解。它明确了从当前状态可以进行的所有可能“选择”或“转移”，以及这些选择如何影响状态的变化。
例如，斐波那契数列的状态转移方程是 $D P [n] = D P [n - 1] + D P [n - 2]$ 。爬楼梯问题中，到达第 $i$ 级台阶的方法数等于到达第 $i - 1$ 级的方法数（再爬1级）加上到达第 $i - 2$ 级的方法数（再爬2级）。
这个方程是动态规划的灵魂，它将子问题的解联系起来，构成了整个求解过程的骨架。

步骤 4：确定边界条件 (Base Cases)
边界条件（或称基本情况）是指那些不能再分解、其解是已知的最简单子问题。它们是递推的起点（对于自底向上的递推）或递归的终点（对于自顶向下的记忆化搜索）。
例如，斐波那契数列的边界条件是 $D P [0] = 0, D P [1] = 1$ 。爬楼梯问题中，通常定义到达第0级台阶有1种方法（原地不动），到达第1级台阶有1种方法。
没有正确的边界条件，递推过程无法开始，递归过程也无法结束。思考边界条件时，可以考虑状态变量取最小值或特殊值时，问题的解是什么。

步骤 5：选择实现方式 (自顶向下或自底向上)
根据问题的特点和个人偏好，选择使用记忆化搜索（递归）还是递推（迭代）来实现。递归方案通常对应自顶向下，而迭代方案对应自底向上。

步骤 6：实现算法并进行优化
根据选择的方式编写代码。如果是记忆化搜索，则在递归函数中加入备忘录。如果是递推，则初始化DP表并按照状态转移方程填充。
许多动态规划问题都涉及到在每一步做出“选择”，例如是否选取当前物品（背包问题），或者当前步骤是走一步还是两步（爬楼梯问题）。这种选择的结构天然地适合用递归来表达，每个递归调用代表一个状态，函数内部则根据不同的选择进行进一步的递归调用。

步骤 7：分析时间复杂度和空间复杂度
最后，分析算法的时间复杂度和空间复杂度。时间复杂度通常取决于状态的总数乘以每个状态计算所需的时间。空间复杂度则主要取决于存储状态解（DP表或备忘录）所需的空间。

解决动态规划问题的过程往往不是一蹴而就的线性过程，而可能是一个迭代和细化的过程。可能需要反复审视状态的定义、状态转移方程的正确性以及边界条件是否完备。

第五章：动态规划实战演练

理论学习之后，通过具体的例子来实践是理解动态规划的关键。本章将通过几个经典的动态规划问题，详细展示如何应用上一章的解题框架。

5.1 一维动态规划：斐波那契数列与爬楼梯

一维动态规划通常指状态可以用单个变量（如下标 $i$ ）来表示的动态规划问题。其DP表通常是一个一维数组。

5.1.1 经典入门：斐波那契数列 (Fibonacci Sequence)

斐波那契数列是一个理想的入门例子，因为它清晰地展示了动态规划的两个核心特性：最优子结构和重叠子问题。

问题描述：计算斐波那契数列的第 $n$ 项。斐波那契数列定义为： $F (0) = 0, F (1) = 1$ , 且对于 $1n\>1$ , $F (n) = F (n - 1) + F (n - 2)$ 。
动态规划特性：
- 最优子结构： $F (n)$ 的值由其子问题 $F (n - 1)$ 和 $F (n - 2)$ 的最优解（即它们各自的斐波那契数值）直接相加得到。
- 重叠子问题：在递归计算 $F (n)$ 的过程中，许多较小的斐波那契数（如 $F (n - 2), F (n - 3)$ 等）会被重复计算多次。例