动态规划

本文探讨了如何利用动态规划解决多阶段决策问题,包括最短路径、资源分配及生产库存等问题。文中详细介绍了马尔科夫性、最优化原理等关键概念,并给出了求解步骤与方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

多阶段决策问题

  1. 最短路问题
  2. 资源分配问题
  3. 生产库存问题
    最短路问题的动态规划模型
    minV1,5(s1,p1,5)=k=15(dkuk)s.t.sk+1=Tk(sk,uk),1k5skSk,uk(sk)Uk(sk),k=1,2,...,5

    给定sk,系统以后的状态完全有k及其以后的各阶段的决策所决定和系统由什么路径到达sk无关,即和s1,s2...,sk的取值无关。
    该特点称为马尔科夫性或者无后效性,用动态规划求解的多阶段模型必须具有无后效性。

最优化原理

最优策略:对于先前决策所形成的状态而言,其以后的所有决策应能构成最优策略。
该原理适用于所有满足马尔科夫性的序贯决策问题。

使用动态规划解决多阶段决策问题的一般步骤

  1. 明确问题,找出阶段数。
  2. 明确变量,找出状态变量和决策变量。
  3. 找出状态转移方程。
  4. 写出递推关系式。
  5. 求解递推关系式。

    不定期问题

    值迭代法

    做初始函数f1(i),i=1,2,...,N

    {f1(i)=ciN,i=1,2,..,N1f1(N)=0

    然后用下列递推关系求解{fk(i)}
    {fk(i)=min{cij+fk1(j)},i=1,2,...,N1fk(N)=0

策略空间迭代法

一个策略{s(i)}就是给定点pi时,选定下一步的位置是s(i)
给定初始策略{s0(i)}{s0(i)}是一个无回路的策略,在此策略下做方程组

{f0(i)=cis0(i)+f0(s0(i)),i=1,2,...,N1f0(N)=0
改方程有唯一解。接触f0(i)以后,求
minj{cij+f0(j)},i=1,2,...,N1

minj{cij+f0(j)}=cii1+f0(i1)则令
s1(i)=i1,i=1,2,...,N1
由此得到一个新的策略,用这个策略重复上边做法,知道对所有的i都有sk(i)=sk1(i),那么sk(i)就是最优解。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值