51、部分自适应子模最大化:理论与算法

部分自适应子模最大化:理论与算法

在机器学习和人工智能领域,自适应顺序决策是核心任务之一。典型的自适应顺序决策问题旨在设计一种交互式策略,根据部分观察结果顺序选择一组项目,以最大化预期效用。许多实际应用中的效用函数具有自适应子模性,但大多数现有研究集中在完全自适应设置上,这种设置完成选择过程可能需要较长时间。本文提出了一种部分自适应子模最大化方法,允许批量进行多个选择并一起观察,减少了观察等待时间。

1. 引言

自适应顺序决策在许多机器学习和人工智能任务中处于核心地位。例如,在实验设计中,从业者希望通过一系列测试来获取最大量的“信息”,以得出有效和客观的结论。在许多实际应用中,如基于池的主动学习、传感器选择和自适应病毒营销,效用函数具有自适应子模性。自适应子模性是将子模性从集合推广到策略的概念。

现有的自适应子模最大化研究大多集中在完全自适应设置,即每次选择都必须在观察到所有过去选择的反馈后进行。这种方法虽然能充分利用过去的反馈做出明智决策,但与非自适应解决方案相比,完成选择过程可能需要更长时间,特别是在收集过去选择的观察结果耗时较长的情况下。

本文研究的部分自适应子模最大化问题允许同时进行多个选择并一起观察其实现。这种设置推广了非自适应和完全自适应设置,与完全自适应策略相比,在使用更少批次的情况下享受自适应的好处。本文的主要贡献如下:
- 研究了受基数约束的部分自适应子模最大化问题,开发了一种部分自适应贪婪策略,该策略相对于最优完全自适应策略实现了α/e的近似比,其中α是策略的自适应程度。通过调整α的值,可以平衡性能和自适应之间的权衡。
- 对于受背包约束的部分自适应子模最大化问题,开发了一种基于采样的部分自适应策略,相对于最优完全自适应

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值