开源 | AuctionNet: 针对大规模博弈环境的出价决策Benchmark

▐  摘要

大规模博弈环境中的决策智能是人工智能领域内的重要研究方向,对实际应用具有深远影响。然而,由于缺乏全面且真实的博弈环境及相关数据集,这一领域的进展受到了限制。为了解决这一问题,本文提出了一种基于在线广告行业的自动出价决策问题的Benchmark,并命名为AuctionNet。AuctionNet包括一个大规模广告竞拍环境、基于该环境预生成的数据集以及几种基础出价决策算法的效果评估。广告竞拍环境通过深度生成式模型生成广告流量数据,旨在缩小仿真环境与现实问题之间的差距,同时避免敏感数据暴露的风险。数据集中包含了48个不同出价智能体相互竞价的日志,可帮助出价模型更好的训练。这个数据集共有5亿条记录,共计80GB。AuctionNet已应用于NeurIPS 2024竞赛,为1500支队伍提供了近万次准确、公正的算法效果评估,并帮助选手研发更多元、创新性的解决方案。AuctionNet不仅适用于广告拍卖中的出价决策算法研究,也适用于大型博弈场景的决策智能算法研究。

论文:AuctionNet: A Novel Benchmark for Decision-Making in Large-Scale Games

作者:Kefan Su, Yusen Huo, Zhilin Zhang, Shuai Dou, Chuan Yu, Jian Xu, Zongqing Lu, Bo Zheng

发表会议:NeurIPS 2024 Datasets and Benchmarks Track(Spotlight)

论文下载:https://arxiv.org/abs/2412.10798

代码地址:https://github.com/alimama-tech/AuctionNet

1. 引言

在人工智能领域,大规模博弈中的决策问题是一个基础性的研究方向。在大规模博弈中,智能体需要在竞争环境下,在特定约束条件下做出正确的决策以实现其目标。智能决策的研究进展对广泛的现实应用产生了深远影响。在线广告是其中一种代表性的应用。其市场规模在2023年超过6000亿美元。这一领域需要在大规模博弈中运用复杂的决策技术。具体来说,在线广告系统主要通过流量拍卖的方式实现广告投放。而自动出价技术是衍生于这一场景的一项重要技术。如图1所示,自动出价的智能体代表广告主对大量持续到来的广告流量进行出价,目标是在满足特定约束条件(如投资回报率ROI)的前提下实现效益最大化。

1b5008fdbdc1710f649f9dab95b8f0f6.png
图1:大规模在线广告平台总体架构

大规模广告拍卖中的出价决策是大规模博弈决策的一个典型例子。然而,研究人员通常只能有限地访问到真实的大规模广告竞拍环境,这一现状会对该领域的研究造成阻碍。尽管业界已经有了部分工作旨在为研究者提供一个仿真环境,但此类仿真环境大都无法对广告系统中的复杂的流量分布及博弈行为进行很好的描述,且可扩展性不足,无法很好支持研究者对问题进行广泛的研究。

在本文中,我们提出了AuctionNet——源自真实在线广告平台的大规模广告出价决策基准。AuctionNet由三个部分组成:广告竞拍环境、基于该环境的预生成数据集以及对几种基线出价决策算法的性能评估。具体来说,该环境通过多个模块的交互,有效地复制了真实世界广告竞价的完整性和复杂性:广告流量生成模块基于深度生成式模型。这种方法可以缩小模拟数据和真实世界数据之间的差距,同时降低敏感数据暴露的风险;出价模块实现了使用不同决策算法训练的多样化;拍卖机制模块基于广义二价(GSP)拍卖机制,同时也允许根据需要定制拍卖机制。为了促进研究并提供对博弈环境的深入了解,我们还基于该环境预生成了一个大型数据集。该数据集包含48个不同

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值