强化学习在受限投资组合管理与自动谈判中的应用
在当今的金融和人工智能领域,强化学习正发挥着越来越重要的作用。本文将探讨强化学习在受限投资组合管理以及自动谈判代理框架中的应用,介绍相关的方法、实验结果以及创新点。
受限投资组合管理:基于动作空间分解的强化学习方法
在投资组合管理中,常常会遇到各种约束条件。例如,需要对特定行业的资产分配进行限制,或者在卖空一组资产的同时增加对另一组资产的投资。为了解决这些问题,研究人员提出了一种名为ADBO的方法。
实验评估
训练完成后的评估结果如下表所示:
|设置|SUSTA设置 - 总经济回报(12个月)|SUSTA设置 - 总违规次数|SHORT设置 - 总经济回报(12个月)|SHORT设置 - 总违规次数|
| ---- | ---- | ---- | ---- | ---- |
|(A) 环境 - RCPO|0.2238|0|0.2418|8656|
|(A) 环境 - IPO|0.2013|0|0.2721|11943|
|(A) 环境 - P3O|0.2561|9|0.3512|10865|
|(A) 环境 - ADBO (Ours)|0.2603|0|0.4272|0|
|(B) 回测 - RCPO|0.4640|0|0.5285|9|
|(B) 回测 - IPO|0.3499|0|0.6262|12|
|(B) 回测 - P3O|0.5475|0|0.7654|11|
|(B) 回测 - ADBO (Ours)|0.5758|0|1.0205|0|
从表格中可以看出,ADBO方法在总经济回
强化学习在投资与谈判中的应用
超级会员免费看
订阅专栏 解锁全文
1219

被折叠的 条评论
为什么被折叠?



