动态规划的思想就是,把一个待解决的问题,分为若干个子问题,按顺序求解,前一个子问题的解为后一个子问题的解提供了有用的信息。在求解任一局部解的过程中,列出各种可能的局部解,通过决策保留那些最优解,依次解决各子问题,最后一个子问题就是初始问题的解。
利用动态规划解决的问题的特征:
1,有重叠子问题。
2,如果问题的最优解所包含的子问题的解也是最优的,就称该问题具有最优子结构,即满足最优化原理。
3,某状态以后的过程不会影响以前的状态,只与当前状态有关。
解决这类问题的思路:
1,划分阶段:按照问题的时间或空间特征,把问题分为若干个阶段。在划分阶段时,注意划分后的阶段一定要是有序的或者是可排序的,否则问题就无法求解。
2,确定状态和状态变量:将问题发展到各个阶段时所处于的各种客观情况用不同的状态表示出来。当然,状态的选择要满足无后效性。
3,确定决策并写出状态转移方程:因为决策和状态转移有着天然的联系,状态转移就是根据上一阶段的状态和决策来导出本阶段的状态。所以如果确定了决策,状态转移方程也就可写出。但事实上常常是反过来做,根据相邻两个阶段的状态之间的关系来确定决策方法和状态转移方程。
4,寻找边界条件:给出的状态转移方程是一个递推式,需要一个递推的终止条件或边界条件。
一般,只要解决问题的阶段、状态和状态转移决策确定了,就可以写出状态转移方程(包括边界条件)。实际应用中可以按以下几个简化的步骤进行设计:
(1)分析最优解的性质,并刻画其结构特征。
(2)递归的定义最优解。
(3)以自底向上或自顶向下的记忆化方式(备忘录法)计算出最优值
(4)根据计算最优值时得到的信息,构造问题的最优解
动态规划的三要素:
1,问题的阶段。2,每个阶段的状态。3,从前一个阶段转化到后一个阶段之间的递推关系。