摘自《ACM/ICPC承租设计与分析》 沈云付 编著 清华大学出版社
一、动态规划的基本思想
动态规划:动态规划就是在多阶段决策问题中,各阶段采取的决策依赖于目前状态,并引起状态的转移,以期求得最优化的过程。
动态规划中当前阶段的状态依赖于上一阶段和上一阶段的决策结果。
状态转移方程:第k阶段的状态Sk和本阶段的决策Dk确定第k+1阶段的状态Sk+1的过程叫状态转移。状态转移规律可用等式Sk+1=Fk(Sk,Dk)形式化表示;该等式称为状态转移方程。
算法思想:
(1)动态规划算法将待求解问题分解成若干个子问题,先求解子问题。
(2)从这些子问题的解得到原问题的解。这些子问题往往不互相独立。
(3)分解时得到的子问题数目可能很多,但如果能够保存已解决的子问题的解,而在需要时再找出已求得的答案,就可以避免大量重复计算,从而有可能得到多项式时间算法。
二、动态规划算法的基本要素
(1)最优子结构:当问题的最优解包含了其子问题的最优解时,称该问题具有最优子结构性质。
(2)重叠子问题:在用递归算法自顶向下解问题时,每次产生的子问题并不总是新问题,有些子问题被反复计算多次。这种性质称为子问题的重叠性质。
三、动态规划求解步骤
(1)找出最优解的性质,并刻画其结构特征。
(2)递归地定义最优值(写出状态转移方程,或称动态规划方程)。
(3)以自底向上(或自顶向下)的方式计算出最优值。
(4)根据计算最优值时得到的信息,构造一个最优解。
四、动态规划原理
无论初始状态及初始决策如何,对于先前决策所形成的状态而言,其以后的所有决策应构成最优策略,简言之,就是“最优策略的子策略也是最优策略”。