52、数值动态规划的进展与新应用

数值动态规划的进展与新应用

在经济和金融领域的动态规划问题求解中,数值方法起着至关重要的作用。动态规划算法在解决诸多问题时展现出独特优势,下面我们将深入探讨数值动态规划中涉及的工具以及形状保持动态规划的相关内容。

数值分析工具

数值动态规划主要包含三个核心组件:优化、数值积分和近似。

优化

在值函数迭代过程中,优化步骤是最耗时的部分。在算法 1 中,时间 t 有 Nt 个优化任务,每个近似节点对应一个。若值函数迭代次数为 T,则优化任务总数为 $\sum_{t = 1}^{T} N_t$。这些优化任务通常是具有少量选择变量的相对小问题,算法性能取决于这些问题的求解速度。
- 若值函数近似不光滑,最大化步骤中优化问题的目标函数也不光滑,此时需使用能解决非光滑问题的方法。
- 若值函数近似光滑,可使用牛顿法及相关的约束非线性优化问题方法,这些方法具有局部二次收敛速度。
我们常使用 NPSOL(Gill 等人,1994),它是一组用于最小化受线性和非线性约束的光滑函数的 Fortran 子程序。NPSOL 库可从 Fortran、C/C++ 或 MATLAB 的驱动程序中调用,适用于经济和金融领域的动态规划应用,因为数值动态规划中的优化任务多为小规模光滑问题。

数值积分

在贝尔曼方程的目标函数中,常需计算 V (x+) 的条件期望。当随机变量连续时,需用数值积分计算期望,高斯求积规则常用于此。
- 高斯 - 埃尔米特求积 :若随机变量服从正态分布,应用高斯 - 埃尔米特求积公式计算数值积分效果良好。若要计算 E{ f (Y)},其中 Y 服从

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值