动态规划概述

动态规划思想

动态规划概念:(dynamic programming)求解决策过程最优化的数学方法

  • 动态规划思想:
    把多阶段过程转化成一系列单阶段问题,利用各阶段之间的关系,逐个求解

  • 动态规划分类:
    线性动规 区域动规 树型动规 背包动规

  • 动态规划的基本解题思路:

    1. 以时间划分阶段,分成子问题,使其拥有最优化子结构。(最优化原理: 对于原问题,它的一个最优策略的子策略总是最优的,称为其满足最优子结构。)
    2. 确定状态方程:k阶段的状态变量x(k)确定后,x(k+1)也完全确定,x(k+1)随x(k)和k阶段的决策u(k)变化而变化。从k阶段到k+1阶段的状态转移规律,称为状态转移方程。
    3. 填表:记录子问题的答案,填二维表 (动态规划的解题思路)
  • 多阶段决策问题:
    每一阶段有多个策略可选,在可以选择的那些策略中间,选择一个最优策略

  • 几个概念:
    阶段:一个动态规划问题需要被分成多个阶段
    状态:每个阶段有多个状态
    无后效性:当前状态对未来的决策有影响,历史决策对未来决策无影响
    决策:在当前阶段策略集合中选择达到最优效果的策略

注:在大概明白了动态规划的概念之上,去具体的分析某一类问题。如果不太理解动态规划是啥,解决问题的时候,不要拘泥于动态规划的思想上面,自己动手分析一下,从具体的问题上去理解动态规划的思想。(建议从01背包的问题入手 01背包问题

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值