动态规划DP原理

摘自《ACM/ICPC承租设计与分析》 沈云付 编著 清华大学出版社

一、动态规划的基本思想


动态规划:动态规划就是在多阶段决策问题中,各阶段采取的决策依赖于目前状态,并引起状态的转移,以期求得最优化的过程。


动态规划中当前阶段的状态依赖于上一阶段和上一阶段的决策结果。


状态转移方程:第k阶段的状态Sk和本阶段的决策Dk确定第k+1阶段的状态Sk+1的过程叫状态转移。状态转移规律可用等式Sk+1=Fk(Sk,Dk)形式化表示;该等式称为状态转移方程。

算法思想:

(1)动态规划算法将待求解问题分解成若干个子问题,先求解子问题。

(2)从这些子问题的解得到原问题的解。这些子问题往往不互相独立。

(3)分解时得到的子问题数目可能很多,但如果能够保存已解决的子问题的解,而在需要时再找出已求得的答案,就可以避免大量重复计算,从而有可能得到多项式时间算法。

二、动态规划算法的基本要素

(1)最优子结构:当问题的最优解包含了其子问题的最优解时,称该问题具有最优子结构性质。

(2)重叠子问题:在用递归算法自顶向下解问题时,每次产生的子问题并不总是新问题,有些子问题被反复计算多次。这种性质称为子问题的重叠性质。

三、动态规划求解步骤

(1)找出最优解的性质,并刻画其结构特征。

(2)递归地定义最优值(写出状态转移方程,或称动态规划方程)。

(3)以自底向上(或自顶向下)的方式计算出最优值。

(4)根据计算最优值时得到的信息,构造一个最优解。

四、动态规划原理
     无论初始状态及初始决策如何,对于先前决策所形成的状态而言,其以后的所有决策应构成最优策略,简言之,就是“最优策略的子策略也是最优策略”。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值