部分自适应子模最大化:理论与算法
在机器学习和人工智能领域,自适应顺序决策是核心任务之一。典型的自适应顺序决策问题旨在设计一种交互式策略,根据部分观察结果顺序选择一组项目,以最大化预期效用。许多实际应用中的效用函数具有自适应子模性,但大多数现有研究集中在完全自适应设置上,这种设置完成选择过程可能需要较长时间。本文提出了一种部分自适应子模最大化方法,允许批量进行多个选择并一起观察,减少了观察等待时间。
1. 引言
自适应顺序决策在许多机器学习和人工智能任务中处于核心地位。例如,在实验设计中,从业者希望通过一系列测试来获取最大量的“信息”,以得出有效和客观的结论。在许多实际应用中,如基于池的主动学习、传感器选择和自适应病毒营销,效用函数具有自适应子模性。自适应子模性是将子模性从集合推广到策略的概念。
现有的自适应子模最大化研究大多集中在完全自适应设置,即每次选择都必须在观察到所有过去选择的反馈后进行。这种方法虽然能充分利用过去的反馈做出明智决策,但与非自适应解决方案相比,完成选择过程可能需要更长时间,特别是在收集过去选择的观察结果耗时较长的情况下。
本文研究的部分自适应子模最大化问题允许同时进行多个选择并一起观察其实现。这种设置推广了非自适应和完全自适应设置,与完全自适应策略相比,在使用更少批次的情况下享受自适应的好处。本文的主要贡献如下:
- 研究了受基数约束的部分自适应子模最大化问题,开发了一种部分自适应贪婪策略,该策略相对于最优完全自适应策略实现了α/e的近似比,其中α是策略的自适应程度。通过调整α的值,可以平衡性能和自适应之间的权衡。
- 对于受背包约束的部分自适应子模最大化问题,开发了一种基于采样的部分自适应策略,相对于最优完全自适应
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



