动态规划之最优化原理与动态规划方程

本文介绍了动态规划,它由美国数学家贝尔曼等在1951年创立。动态规划无统一数学模型和数值解处理方法。文中阐述了其原理,包括最短路问题解法、基本概念和术语,还介绍了最优化原理、逆序和顺序动态规划方程,以及动态规划基本定理。

动态规划

引言

  1951年,美国数学家贝尔曼(R.Bellman)等根据一类所谓多阶段决策问题的特性,提出了解决这类问题的“最优化原理”,并研究了许多实际问题,从而创立了最优化的一个新分支----动态规划
  动态规划没有统一的数学模型,对不同的问题要采用不同的方法去建立它们的模型。有了模型之后,要想得到数值解,仍然没有统一的处理方法。这是应当注意的。

1 动态规划原理

1.1 最短路问题及其解法

最短路问题及其解法

1.2 动态规划的基本概念和术语

动态规划的基本概念和术语

1.3 最优化原理与动态规划方程

1.3.1 最优化原理

  对于多阶段决策问题,作为整个过程的最优策略必然具有这样的性质:无论过去的状态和决策如何,就所形成的状态而言,余下的诸策略必然构成一个最优子策略。多阶段决策问题的这一规律称为最优化原理

1.3.2 逆序动态规划方程

  对后部指标函数 F k , n F_{k,n} Fk,n及最优函数 f k ( x k ) f_k(x_k) fk(xk)

  (1)当 F k , n = ∑ j = k n d ( x j , u j ) F_{k,n}=\sum\limits_{j=k}^nd(x_j,u_j) Fk,n=j=knd(xj,uj)时, f k ( x k ) 满 足 递 推 方 程 f_k(x_k)满足递推方程 fk(xk)
{ f k ( x k ) = o p t u k ∈ D k { d ( x k , u k ) + f k + 1 ( x k + 1 ) } , f n + 1 ( x n + 1 ) = 0 , k = n , n − 1 , ⋯   , 2 , 1 \left\{ \begin{array}{lcl} f_k(x_k) = \mathop{opt} \limits_{u_k \in D_k} \{ d(x_k,u_k) + f_{k+1}(x_{k+1})\} ,\\ f_{n+1}(x_{n+1})=0, k=n,n-1,\cdots,2,1 \end{array} \right. { fk(xk)=ukDkopt{ d(xk,uk)+fk+1(xk+1)}fn+1(x

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值