目录
动态规划
引言
1951年,美国数学家贝尔曼(R.Bellman)等根据一类所谓多阶段决策问题的特性,提出了解决这类问题的“最优化原理”,并研究了许多实际问题,从而创立了最优化的一个新分支----动态规划。
动态规划没有统一的数学模型,对不同的问题要采用不同的方法去建立它们的模型。有了模型之后,要想得到数值解,仍然没有统一的处理方法。这是应当注意的。
1 动态规划原理
1.1 最短路问题及其解法
1.2 动态规划的基本概念和术语
1.3 最优化原理与动态规划方程
1.3.1 最优化原理
对于多阶段决策问题,作为整个过程的最优策略必然具有这样的性质:无论过去的状态和决策如何,就所形成的状态而言,余下的诸策略必然构成一个最优子策略。多阶段决策问题的这一规律称为最优化原理。
1.3.2 逆序动态规划方程
对后部指标函数 F k , n F_{k,n} Fk,n及最优函数 f k ( x k ) f_k(x_k) fk(xk)有
(1)当 F k , n = ∑ j = k n d ( x j , u j ) F_{k,n}=\sum\limits_{j=k}^nd(x_j,u_j) Fk,n=j=k∑nd(xj,uj)时, f k ( x k ) 满 足 递 推 方 程 f_k(x_k)满足递推方程 fk(xk)满足递推方程
{ f k ( x k ) = o p t u k ∈ D k { d ( x k , u k ) + f k + 1 ( x k + 1 ) } , f n + 1 ( x n + 1 ) = 0 , k = n , n − 1 , ⋯ , 2 , 1 \left\{ \begin{array}{lcl} f_k(x_k) = \mathop{opt} \limits_{u_k \in D_k} \{ d(x_k,u_k) + f_{k+1}(x_{k+1})\} ,\\ f_{n+1}(x_{n+1})=0, k=n,n-1,\cdots,2,1 \end{array} \right. {
fk(xk)=uk∈Dkopt{
d(xk,uk)+fk+1(xk+1)},fn+1(x

本文介绍了动态规划,它由美国数学家贝尔曼等在1951年创立。动态规划无统一数学模型和数值解处理方法。文中阐述了其原理,包括最短路问题解法、基本概念和术语,还介绍了最优化原理、逆序和顺序动态规划方程,以及动态规划基本定理。
最低0.47元/天 解锁文章
693

被折叠的 条评论
为什么被折叠?



