简介
动态规划(Dynamic Programming)是运筹学的一个分支,是求解决策过程(decision process)最优化的数学方法。
20世纪50年代初美国数学家R.E.Bellman等人在研究多阶段决策过程(multistep decision process)的优化问题时,提出了著名的最优化原理(principle of optimality)
在现实生活中,有一类活动的过程,由于它的特殊性,可将过程分成若干个互相联系的阶段,在它的每一阶段都需要作出决策,从而使整个过程达到最好的活动效果。
各个阶段决策的选取不是任意确定的,它依赖于当前面临的状态,又影响以后的发展,
这种把一个问题看作是一个前后关联具有链状结构的多阶段过程就称为多阶段决策过程,这种问题就称为多阶段决策问题。
基本思想
动态规划算法通常用于求解具有某种最优性质的问题。
在这类问题中,可能会有许多可行解。
我们希望找到具有最优值的解。
基本思想是将待求解问题分解成若干个子问题,先求解子问题,然后从这些子问题的解得到原问题的解。
动态规划问题的特征
动态规划算法的有效性依赖于问题本身所具有的两个重要性质:
最优子结构:
当问题的最优解包含了其子问题的最优解时,称该问题具有最优子结构性质。
重叠子问题: