数值动态规划的进展与形状保持特性应用
在数值计算领域,动态规划算法有着独特的优势,它能用于解决诸如增长模型和投资组合问题等。下面将详细介绍数值动态规划所需的数值分析工具,以及形状保持特性在动态规划中的应用。
数值分析工具
数值动态规划主要包含三个核心部分:优化、数值积分和近似。
优化
在值函数迭代中,优化步骤是最耗时的。在算法 1 里,时间 $t$ 时有 $N_t$ 个优化任务,每个近似节点对应一个。若值函数迭代次数为 $T$,那么总的优化任务数为 $\sum_{t = 1}^{T} N_t$。这些优化任务通常是具有少量选择变量的小规模问题,算法性能取决于这些问题的求解速度。
- 若值函数近似不光滑,最大化步骤中优化问题的目标函数也不光滑,此时需采用能解决非光滑问题的方法。
- 若值函数近似光滑,可使用牛顿法及相关的约束非线性优化方法,这些方法具有局部二次收敛速度。
实际中,常使用 NPSOL(Gill 等人,1994),它是一组用于在线性和非线性约束下最小化光滑函数的 Fortran 子程序。可从 Fortran、C/C++ 或 MATLAB 的驱动程序中调用 NPSOL 库,因其适用于经济和金融领域的动态规划应用,数值动态规划中的优化任务多为小规模光滑问题。
数值积分
在贝尔曼方程的目标函数中,常需计算 $V (x+)$ 的条件期望。当随机变量连续时,需用数值积分计算期望,高斯求积规则常被用于积分计算。
- 高斯 - 埃尔米特求积 :若随机变量服从正态分布,应用高斯 - 埃尔米特求积公式计算数值积分效果较好。若要计算 $E{ f (
超级会员免费看
订阅专栏 解锁全文
1828

被折叠的 条评论
为什么被折叠?



