动态经济模型学习方法的比较与探索
1. 方法比较方式
在比较不同方法时,通常采用两种方式:
- 统计蒙特卡罗模拟中,每种方法在与其他两种方法对比时,平均准则值最低的运行次数占比。
- 计算三种方法在蒙特卡罗模拟运行中的平均准则值。
以对Beck和Wieland(2002)模型的求解为例,比较了最优反馈(OF)、期望最优反馈(EOF)和双重控制(DC)三种方法。结果显示,在“运行次数”比较中,简单的OF方法相对复杂的EOF和DC方法表现较好;而在比较平均准则值时,DC方法优于EOF方法,EOF方法又优于OF方法。
这种差异可以简单解释为:不太复杂的OF方法在大多数情况下可能效果较好,但在效果不佳的情况下,表现会很差。例如,当参数估计的初始值接近真实值时,OF方法相对EOF和DC方法表现良好;但当初始值远离真实值时,EOF方法谨慎处理这些值,DC方法则主动干扰系统以提高学习率,从而在后续阶段获得更接近真实值的参数估计,这两种方法会更有优势。
由于平均准则值方法在大多数学习场景中更有用,因此认为DC方法优于EOF和OF方法,但DC方法究竟好多少还需进一步探讨。同时,三种方法的排名可能非常依赖于模型。有些模型可能呈现出DC > EOF > OF的预期排名,但其他模型的排名可能不同。
2. 时间变化参数的影响
考虑同一模型的两种版本,即参数恒定和参数随时间变化的版本。使用“平均准则值”方法时,从参数恒定版本过渡到参数随时间变化版本时,DC方法和EOF方法之间的差异可能会减小。这是因为当参数的真实值随时间变化时,学习带来的收益会减少。然而,也有人认为在参数真实值随时间变化的情况下,干扰系统以跟踪这
动态经济模型学习方法比较
超级会员免费看
订阅专栏 解锁全文
4281

被折叠的 条评论
为什么被折叠?



