64、动态规划：理论与应用

Mars5

于 2025-10-05 09:43:47 发布

阅读量15

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习与数据挖掘精要文章标签：动态规划马尔可夫决策过程贝尔曼方程

本文链接：https://blog.youkuaiyun.com/mars5/article/details/154601059

机器学习与数据挖掘精要专栏收录该内容

99 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

动态规划：理论与应用

1. 动态规划概述

动态规划的起源可以追溯到十七世纪的变分法问题研究。不过，现代对随机序贯决策问题的研究，一般认为始于1947年Wald在序贯统计分析方面的工作。几乎在同一时期，Pierre Masse也在法国针对水资源管理问题进行了类似的分析。而与动态规划紧密相关的关键人物是Richard Bellman，他建立了构成动态规划基础的最优性方程。

动态规划的应用范围十分广泛，表1展示了其应用的广度，同时凸显了大多数实例的随机性质。

应用场景	系统状态	动作	奖励	随机因素
产能规划	工厂规模	维持或增加产能	扩张和当前产能生产的成本	产品需求
现金管理	可用现金	借贷或投资	交易成本和利息	外部现金需求
目录邮寄	客户购买记录	发送目录类型（若有）	当前周期购买减去邮寄成本	客户购买金额
临床试验