基本概念
动态规划过程是:每次决策依赖于当前状态,又随即引起状态的转移。一个决策序列就是在变化的状态中产生出来的,所以,这种多阶段最优化决策解决问题的过程就称为动态规划(DP)。
基本思想与策略
基本思想与分治法类似,也是将待求解的问题分解为若干个子问题(阶段),按顺序求解子阶段,前一子问题的解,为后一子问题的求解提供了有用的信息。在求解任一子问题时,列出各种可能的局部解,通过决策保留那些有可能达到最优的局部解,丢弃其他局部解。依次解决各子问题,最后一个子问题就是初始问题的解。由于动态规划解决的问题多数有重叠子问题这个特点,为减少重复计算,对每一个子问题只解一次,将其不同阶段的不同状态保存在一个二维数组中。与分治法最大的差别是:适合于用动态规划法求解的问题,经分解后得到的子问题往往不是互相独立的(即下一个子阶段的求解是建立在上一个子阶段的解的基础上,进行进一步的求解)。
动态规划算法的难点在于 从实际问题中抽象出动态规划表dp,dp一般是一个数组,可能是一维的也可能是二维的,也可能是其他的数据结构:整个求解过程就可以用一个最优决策表来描述,最优决策表可以是一个二维表,其中行表示决策的阶段,列表示问题状态,表格需要填写的数据一般对应此问题的在某个阶段某个状态下的最优值(如最短路径,最长公共子序列,最大价值等),填表的过程就是根据递推关系,从1行1列开始,以行或者列优先的顺序,依次填写表格,最后根据整个表格的数据通过简单的取舍或者运算求得问题的最优解
动态规划的具体步骤
(1)划分阶段:按照问题的时间或空间特征,把问题分为若干个阶段。在划分阶段时,注意划分后的阶段一定要是有序的或者是可排序的,否则问题就无法求解。
(2)确定状态和状态变量:将问题发展到各个阶段时所处于的各种客观情况用不同的状态表示出来。当然,状态的选择要满足无后效性。
(3)确定决策并写出状态转移方程:因为决策和状态转移有着天然的联系,状态转移就是根据上一阶段的状态和决策来导出本阶段的状态。所以如果确定了决策,状态转移方程也就可写出。但事实上常常是反过来做,根据相邻两个阶段的状态之间的关系来确定决策方法和状态转移方程。
(4)寻找边界条件:给出的状态转移方程是一个递推式,需要一个递推的终止条件或边界条件。
例1:
最简单的台阶问题:有n级台阶,一个人每次上一级或者两级,问有多少种走完n级台阶的方法?
由分析可知:n阶台阶,只可能是从n-1或是n-2的台阶上走上来的,台阶n的阶段依赖的是n-1和n-2的子阶段,所以状态转移方程为dp[n] = dp[n-1] + dp[n-2],属于最简单的动态规划问题
#include <iostream>
#define N 20 //台阶数为20
using namespace std;
int dp[N]; //全局数组,存放决策表
int fun(int n) //返回台阶数为n的走法
{
if (n == 1 || n == 2)
{
return n;
}
dp[n-1] = fun(n-1); //若不为1或2则进行递归计算
dp[n-2] = fun(n-2);
dp[n] = dp[n-1]+dp[n-2]; //状态转移方程
return dp[n];
}
int main(int argc,char** argv)
{
fun(N);
cout<<dp[15]<<endl; //输出15阶的走法
return 0;
}
例2:
最短路径问题:给定一个矩阵m,从左上角开始每次只能向右走或者向下走,最后达到右下角的位置,路径中所有数字累加起来就是路径和,返回所有路径的最小路径和,如果给定的m如下,那么路径1,3,1,0,6,1,0就是最小路径和,返回12.
1 3 5 9
8 1 3 4
5 0 6 1
8 8 4 0由分析可知:走到第(i ,j)个数时,只可能是从(i-1 ,j)或是(i ,j-1)走来的,路径(i ,j)的阶段依赖的是(i-1 ,j)和(i ,j-1)的子阶段,所以状态转移方程为dp[i][j] =a[i][j] + min(dp[i-1][j],dp[i][j-1]),属于简单的动态规划问题
#include <iostream>
#include <algorithm>
using namespace std;
int dp[4][4] = {}; //全局数组,存放决策表
int main(int argc,char** argv)
{
int a[4][4] = {1,3,5,9,8,1,3,4,5,0,6,1,8,8,4,0}; //矩阵存储a[i][j]
for (int i = 0;i < 4;++i)
{
for (int j = 0;j < 4;++j)
{
if (i==0 && j==0) //边界条件问题需要考虑到
{
dp[i][j] = a[i][j];
}
else if (i==0 && j!=0)
{
dp[i][j] = a[i][j] + dp[i][j-1];
}
else if (i!=0 && j==0)
{
dp[i][j] = a[i][j] + dp[i-1][j];
}
else
{
dp[i][j] = a[i][j] + min(dp[i-1][j],dp[i][j-1]);
}
}
}
cout<<"走到位置"<<"(4,4)"<<"最短路径为:";
cout<<dp[3][3]<<endl; //好像到这里又脑残了一次,真输出dp[4][4]了~
system("pause");
return 0;
}
本文介绍了动态规划的基本概念、思想策略和具体步骤,并通过两个实例——最简单台阶问题和最短路径问题,详细阐述了动态规划算法的应用,强调了状态转移方程在求解过程中的关键作用。
555

被折叠的 条评论
为什么被折叠?



