52、数值动态规划的进展与形状保持特性应用

数值动态规划的进展与形状保持特性应用

在数值计算领域,动态规划算法有着独特的优势,它能用于解决诸如增长模型和投资组合问题等。下面将详细介绍数值动态规划所需的数值分析工具,以及形状保持特性在动态规划中的应用。

数值分析工具

数值动态规划主要包含三个核心部分:优化、数值积分和近似。

优化

在值函数迭代中,优化步骤是最耗时的。在算法 1 里,时间 $t$ 时有 $N_t$ 个优化任务,每个近似节点对应一个。若值函数迭代次数为 $T$,那么总的优化任务数为 $\sum_{t = 1}^{T} N_t$。这些优化任务通常是具有少量选择变量的小规模问题,算法性能取决于这些问题的求解速度。
- 若值函数近似不光滑,最大化步骤中优化问题的目标函数也不光滑,此时需采用能解决非光滑问题的方法。
- 若值函数近似光滑,可使用牛顿法及相关的约束非线性优化方法,这些方法具有局部二次收敛速度。
实际中,常使用 NPSOL(Gill 等人,1994),它是一组用于在线性和非线性约束下最小化光滑函数的 Fortran 子程序。可从 Fortran、C/C++ 或 MATLAB 的驱动程序中调用 NPSOL 库,因其适用于经济和金融领域的动态规划应用,数值动态规划中的优化任务多为小规模光滑问题。

数值积分

在贝尔曼方程的目标函数中,常需计算 $V (x+)$ 的条件期望。当随机变量连续时,需用数值积分计算期望,高斯求积规则常被用于积分计算。
- 高斯 - 埃尔米特求积 :若随机变量服从正态分布,应用高斯 - 埃尔米特求积公式计算数值积分效果较好。若要计算 $E{ f (

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值