45、强化学习在受限投资组合管理与自动谈判中的应用

强化学习在投资与谈判中的应用

最新推荐文章于 2025-11-02 09:04:34 发布

放屁带闪电

最新推荐文章于 2025-11-02 09:04:34 发布

阅读量22

点赞数

CC 4.0 BY-SA版权

分类专栏：知识发现的前沿探索文章标签：强化学习投资组合管理自动谈判

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/grafana8visual/article/details/152074977

知识发现的前沿探索专栏收录该内容

62 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

强化学习在受限投资组合管理与自动谈判中的应用

在当今的金融和人工智能领域，强化学习正发挥着越来越重要的作用。本文将探讨强化学习在受限投资组合管理以及自动谈判代理框架中的应用，介绍相关的方法、实验结果以及创新点。

受限投资组合管理：基于动作空间分解的强化学习方法

在投资组合管理中，常常会遇到各种约束条件。例如，需要对特定行业的资产分配进行限制，或者在卖空一组资产的同时增加对另一组资产的投资。为了解决这些问题，研究人员提出了一种名为ADBO的方法。

实验评估

训练完成后的评估结果如下表所示：
|设置|SUSTA设置 - 总经济回报(12个月)|SUSTA设置 - 总违规次数|SHORT设置 - 总经济回报(12个月)|SHORT设置 - 总违规次数|
| ---- | ---- | ---- | ---- | ---- |
|(A) 环境 - RCPO|0.2238|0|0.2418|8656|
|(A) 环境 - IPO|0.2013|0|0.2721|11943|
|(A) 环境 - P3O|0.2561|9|0.3512|10865|
|(A) 环境 - ADBO (Ours)|0.2603|0|0.4272|0|
|(B) 回测 - RCPO|0.4640|0|0.5285|9|
|(B) 回测 - IPO|0.3499|0|0.6262|12|
|(B) 回测 - P3O|0.5475|0|0.7654|11|
|(B) 回测 - ADBO (Ours)|0.5758|0|1.0205|0|

从表格中可以看出，ADBO方法在总经济回

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。