动态规划(DP)算法

本文深入解析动态规划的基本原理,包括无后效性、最优子结构、重叠子问题及状态转移等核心概念。并通过背包问题实例,展示如何运用动态规划算法,逐步解决复杂决策问题,实现利益最大化。

动态规划(Dynamic Programming, DP),在选择DP算法的时候,往往是在决策问题上。动态规划先解决子问题,再逐步解决大问题。

一般情况下,我们能将问题抽象出来,并且问题满足无后效性,满足最优子结构,并且能明确地找出状态转移方程的话,DP是很好的选择。
①无后效性指的是,只要得出了当前状态,而不用管这个状态怎么来的,也就是说之前的状态已经用不着了。如果抽象出的状态有后效性,只用把这个值加入到状态的表示中;
②最优子结构(自下而上):在决策问题中,如果,当前问题可以拆分为多个子问题,并且依赖于这些子问题,那么我们称为此问题符合子结构。而若当前状态可以由某个阶段的某个或某些状态直接得到,那么就符合最优子结构。
③重叠子问题(自上而下):动态规划算法总是充分利用重叠子问题,通过每个子问题只解一次,把解保存在一个需要时就可以查看的表中,每次查表的时间为常数,如备忘录的递归方法、斐波那契数列的递归就是个很好的例子。
④状态转移:这个概念比较简单,在抽象出上述两点的的状态表示后,每种状态之间转移时值或者参数的变化。

背包问题:假设你是一个小偷,背着一个可装4磅东西的背包。可偷窃的商品有如下3件,为了让盗窃的商品价值最高,该选择哪些商品?

对于背包问题,先解决小背包(子背包)问题,在逐步解决原来的问题。
每个动态规划算法都从一个网格开始,网格的各行为商品,各列为不同容量(1~4磅)的背包。背包问题的网格(4*4)如下:

物品1234
吉他(1磅,$1500)
音响(4磅,$3000)
笔记本电脑(3磅,$2000)
  • 吉他行:

第一个单元格表示背包的容量为1磅,而吉他的重量也是1磅,这意味着它能装入背包。
这是第一行,只有吉他可供选择。换言之,你假装现在还没法盗窃其他两件商品。

物品1234
吉他(1磅,$1500)$1500$1500$1500$1500
音响(4磅,$3000)
笔记本电脑(3磅,$2000)

高亮处表示:如果有一个容量为4磅的背包,可在其中装入的商品的最大价值为1500美元。

  • 音响行:

这是第二行,可偷的商品有吉他和音响。在每一行,可偷的商品都为当前行的商品以及之前各行的商品。因此,还不能偷笔记本电脑,而只能偷音响和吉他。
前3列都装不下音响(4磅),若背包容量为4磅(第4列),原来的最大值为1500磅,但如果装入音响而不是吉他,价值将为3000磅。所以丢弃吉他,装入音响。

物品1234
吉他(1磅,$1500)$1500$1500$1500$1500
音响(4磅,$3000)$1500$1500$1500$3000
笔记本电脑(3磅,$2000)
  • 笔记本电脑行:
物品1234
吉他(1磅,$1500)$1500$1500$1500$1500
音响(4磅,$3000)$1500$1500$1500$3000
笔记本电脑(3磅,$2000)$1500$1500$2000$2000 + $1500

前2列都装不下笔记本电脑(3磅)。
对于容量为3磅的背包,原来的最大价值为1500磅,但现在可选择盗窃2000磅的笔记本电脑而不是吉他,这样新的最大价值将为2000磅。
对于容量为4磅的背包,当前的最大价值为3000美元。可以不偷音响而偷笔记本电脑,但只值2000美元,价值没有原来高。但是笔记本电脑只有3磅,背包还有1磅没用。
在1磅的容量中,可装入商品的最大价值在之前计算过(第1列的最后1行)。所以最终为 2000+1500 = 3500磅。

这就是为何要计算小背包可装入商品的最大价值,即当余下了空间时,可根据这些子问题的答案来确定余下的空间可装入哪些商品。

代码表示:

CELL [i][j] = max(1, 2)

  • 上一个单元格的值,即 CELL [i-1][j]
  • 当前商品的价值+剩余空间的价值,剩余空间价值为:CELL [i-1][j-当前商品的重量]

相关题目:

31/100. Palindromic Substrings https://blog.youkuaiyun.com/weixin_39010770/article/details/85699382

参考链接:https://blog.youkuaiyun.com/MrLevo520/article/details/75676160

<think>嗯,用户想了解动态规划算法的原理、实现和应用。首先,我需要回忆动态规划的基本概念。根据引用[2],动态规划适用于有重叠子问题和最优子结构的问题。那什么是重叠子问题呢?比如斐波那契数列,计算fib(5)需要多次计算fib(3),这时候重复计算就可以通过存储中间结果来优化。最优子结构应该是说大问题的最优解包含子问题的最优解,比如最短路径问题。 接下来是原理部分,用户可能想知道动态规划的核心思想。引用[3]提到动态规划通过分解问题,保存中间结果避免重复计算。需要解释状态和状态转移方程,这部分在引用[1]里也有提到,状态转移方程是关键,比如LCS问题中的不同情况处理。 实现方法的话,通常分为自顶向下和自底向上。自顶向下是递归加记忆化,而自底向上是迭代填表。比如斐波那契数列,递归会有很多重复,用数组存储已计算的值可以优化。引用[4]中的例子可能涉及状态转移方程的具体应用,比如最小花费问题。 应用场景方面,动态规划常见于背包问题、最长公共子序列、最短路径等。引用[3]提到Dijkstra算法也是动态规划的一种,这可能是个有趣的例子,但通常Dijkstra被归类为贪心算法,可能需要进一步确认。另外,股票买卖问题也是经典DP应用。 用户可能还希望了解动态规划的优缺点,比如时间复杂度的优化和空间复杂度可能较高的问题。比如,斐波那契数列用DP可以将指数时间降到线性,但需要O(n)空间,不过可以进一步优化到O(1)。 需要确保回答结构清晰,分点解释原理、步骤、实现方法和应用场景。同时,生成的相关问题要覆盖用户可能进一步询问的方向,比如步骤中的关键点或优化技巧。还要注意引用正确的文献,比如引用[2]关于重叠子问题和最优子结构的定义,引用[3]中的状态转移方程例子。 最后,检查是否符合用户的要求:使用中文,LaTeX格式正确,生成相关问题,引用标识正确。例如,数学公式用$...$或$$...$$,代码块用正确的语法,确保没有用户不可见的指令出现在回答中。</think>### 动态规划DP算法详解 #### 一、基本原理 动态规划算法的核心思想是**将复杂问题分解为重叠子问题,并通过保存中间计算结果避免重复计算**,从而提高效率[^2]。其适用条件包括: 1. **最优子结构**:大问题的最优解可由子问题的最优解推导得到 *例如:最短路径问题中,若$A \rightarrow B \rightarrow C$是$A \rightarrow C$的最短路径,则$A \rightarrow B$和$B \rightarrow C$也必须是各自段的最短路径* 2. **重叠子问题**:不同子问题之间存在重复计算 *例如:计算斐波那契数列$F(n)=F(n-1)+F(n-2)$时,$F(3)$会被多次计算* #### 二、实现步骤 1. **定义状态** 用变量或数组表示问题的中间状态,例如: - 斐波那契数列:$dp[i]$表示第$i$项的值 - 背包问题:$dp[i][j]$表示前$i$个物品在容量$j$时的最大价值 2. **建立状态转移方程** 根据子问题之间的关系推导递推公式,例如: - 最长公共子序列(LCS): $$ dp[i][j] = \begin{cases} dp[i-1][j-1]+1 & \text{当 } S1[i]=S2[j] \\ \max(dp[i-1][j], dp[i][j-1]) & \text{当 } S1[i] \neq S2[j] \end{cases} $$ [^3] 3. **确定初始条件和边界值** 例如斐波那契数列中$dp[0]=0, dp[1]=1$ 4. **选择计算顺序** - 自顶向下(记忆化搜索):递归+备忘录 - 自底向上:迭代填表 #### 三、代码实现示例(斐波那契数列) ```python # 自底向上实现 def fib(n): dp = [0] * (n+1) dp[1] = 1 for i in range(2, n+1): dp[i] = dp[i-1] + dp[i-2] # 状态转移方程 return dp[n] # 空间优化版(O(1)空间) def fib_optimized(n): a, b = 0, 1 for _ in range(n): a, b = b, a + b return a ``` #### 四、典型应用场景 1. **序列问题** - 最长递增子序列(LIS) - 编辑距离计算 2. **背包问题** - 0-1背包:$dp[i][j] = \max(dp[i-1][j], dp[i-1][j-w_i] + v_i)$ - 完全背包 3. **路径规划** - 网格最小路径和(状态转移方程:$dp[i][j] = \min(dp[i-1][j], dp[i][j-1]) + grid[i][j]$)[^4] 4. **动态决策问题** - 股票买卖最佳时机 - 打家劫舍问题 #### 五、算法分析 | 特征 | 说明 | |-----------|-----------------------------| | 时间复杂度 | $O(子问题数量 \times 每个子问题计算时间)$ | | 空间复杂度 | 可通过滚动数组优化 | | 优势 | 避免重复计算,效率显著提升 | | 局限性 | 要求问题具有最优子结构 |
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值