带约束的出价优化问题是近年来在互联网广告出价机制上的热点话题,本文主要介绍了基于强化学习的预算约束出价问题,主要结合论文《Budget Constrained Bidding by Model-free ReinforcementLearning in Display Advertising》提出一些自己的思考。
1 背景
所谓的带预算约束的出价策略是一类自动出价问题,是指在客户的原始出价表达外,系统还需要通过微调出价,在不超过客户约预算情况下,使得客户的目标价值最大化。可以将带问题建模为如下线性规划问题。
-
在点击计费情况下表示点击
-
表示点击计费
-
表示预算
-
表示点击客户心理价值,在GSP拍卖场景实际为客户原始出价
通过上式我们可以看出,当系统稳定且完全竞争的情况下,当预算约束恰好满足时,客户的目标价值最大的,此时可以计算系统出价的形式为,这里的实际上是反映了的出价计费系数,这个出价系数可以根据历史数据通过线性规划求解。
因为的分布会随时间发生极大变动,一种

最低0.47元/天 解锁文章
1517

被折叠的 条评论
为什么被折叠?



