动态规划思想
动态规划概念:(dynamic programming)求解决策过程最优化的数学方法
-
动态规划思想:
把多阶段过程转化成一系列单阶段问题,利用各阶段之间的关系,逐个求解 -
动态规划分类:
线性动规 区域动规 树型动规 背包动规 -
动态规划的基本解题思路:
- 以时间划分阶段,分成子问题,使其拥有最优化子结构。(最优化原理: 对于原问题,它的一个最优策略的子策略总是最优的,称为其满足最优子结构。)
- 确定状态方程:k阶段的状态变量x(k)确定后,x(k+1)也完全确定,x(k+1)随x(k)和k阶段的决策u(k)变化而变化。从k阶段到k+1阶段的状态转移规律,称为状态转移方程。
- 填表:记录子问题的答案,填二维表 (动态规划的解题思路)
-
多阶段决策问题:
每一阶段有多个策略可选,在可以选择的那些策略中间,选择一个最优策略 -
几个概念:
阶段:一个动态规划问题需要被分成多个阶段
状态:每个阶段有多个状态
无后效性:当前状态对未来的决策有影响,历史决策对未来决策无影响
决策:在当前阶段策略集合中选择达到最优效果的策略
注:在大概明白了动态规划的概念之上,去具体的分析某一类问题。如果不太理解动态规划是啥,解决问题的时候,不要拘泥于动态规划的思想上面,自己动手分析一下,从具体的问题上去理解动态规划的思想。(建议从01背包的问题入手 01背包问题)