25、风险敏感的在线学习:理论与实践探索

风险敏感的在线学习:理论与实践探索

1. 引言

在在线学习领域,虽然已有大量文献和众多具有最坏情况遗憾界保证的算法,但这些算法几乎都未考虑到投资回报或利润的波动性所带来的风险。在金融相关应用中,对投资组合波动性的考量与回报本身往往同等重要,这种忽视就显得尤为突出。

例如,将标准的 EG 投资组合管理算法应用于最近六年的标准普尔 500 指数时,尽管该算法有理论性能保证,但在所有正学习率下,其回报实际上都不如简单的均匀恒定再平衡投资组合(UCRP)。而风险敏感的在线算法则有可能大幅超越 UCRP。

因此,我们有动力寻找既能像传统方法(如 EG)一样具有保证,又能刻意纳入风险 - 回报权衡的算法。金融领域中常见的平衡风险和回报的方法有夏普比率和均值 - 方差(MV)准则。

  • 夏普比率 :对于给定金融工具在时间序列 $r = (r_1, \ldots, r_T)$ 上的回报,设 $\mu(r)$ 为算术均值,$\sigma(r)$ 为标准差,则夏普比率为 $\mu(r)/\sigma(r)$。
  • 均值 - 方差(MV)准则 :MV 为 $\mu(r) - \sigma(r)$。

我们自然希望在线学习算法在这些风险 - 回报指标上能实现无遗憾结果,但后续研究表明这一期望难以实现。

2. 预备知识
  • 专家与算法 :设专家集合为 $K = {1, \ldots, K}$,在时间 $t \in {1, \ldots, T}$ 时,专家 $k
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值