动态规划:理论与应用
1. 动态规划概述
动态规划的起源可以追溯到十七世纪的变分法问题研究。不过,现代对随机序贯决策问题的研究,一般认为始于1947年Wald在序贯统计分析方面的工作。几乎在同一时期,Pierre Masse也在法国针对水资源管理问题进行了类似的分析。而与动态规划紧密相关的关键人物是Richard Bellman,他建立了构成动态规划基础的最优性方程。
动态规划的应用范围十分广泛,表1展示了其应用的广度,同时凸显了大多数实例的随机性质。
| 应用场景 | 系统状态 | 动作 | 奖励 | 随机因素 |
|---|---|---|---|---|
| 产能规划 | 工厂规模 | 维持或增加产能 | 扩张和当前产能生产的成本 | 产品需求 |
| 现金管理 | 可用现金 | 借贷或投资 | 交易成本和利息 | 外部现金需求 |
| 目录邮寄 | 客户购买记录 | 发送目录类型(若有) | 当前周期购买减去邮寄成本 | 客户购买金额 |
| 临床试验 |
超级会员免费看
订阅专栏 解锁全文
15万+

被折叠的 条评论
为什么被折叠?



