【阅读笔记】快手OCPX广告冷启动影子价格法

本文介绍了如何应用影子价格法解决在线广告平台冷启动问题,通过最大化消耗与冷启动收益之和,利用次梯度下降法求解对偶问题,实现实时广告策略优化。实验表明,此方法能显著提高冷启动成功率和价值。

本文为阅读张任宇老师论文《Cold Start on Online Advertising Platforms: Data-Driven Algorithms and Field Experiments》的读书笔记。据张老师分享,该方法目前被应用到快手广告线上冷启动,取得了不错的收益。

问题背景

信息流广告冷启动面临的核心技术问题:

  1. 新广告数据量不足,其价值难以准确预估
  2. 合理分配广告流量,平衡消耗与冷启动价值
优化目标

找到合适的广告推送策略,最大化消耗与冷启动收益之和

符号说明

广告集合 A : { 1 , 2 , . . . , k } A:\{1,2,...,k\} A:{ 1,2,...,k}

转化出价 b : { b 1 , b 2 , . . . , b k } b:\{b_1,b_2,...,b_k\} b:{ b1,b2,...,bk}

y t , j y_{t,j} yt,j表示广告j是否被展现给用户t=1,2,3,…,T

x t = i x_t=i xt=i表示第t个用户的特征i

c i , j = c t r c_{i,j}=ctr ci,j=ctr 在特征i下广告j的实际点击率

c t , i , j ^ = p c t r \hat{c_{t,i,j}}=pctr ct,i,j^=pctr 用户t特征i下广告j的预估点击率

c v i , j = c t r ∗ c v r cv_{i,j}=ctr*cvr cvi,j=ctrcvr

c v t , i , j ^ = p c t r ∗ p c v r \hat{cv_{t,i,j}}=pctr*pcvr cvt,i,j^=pctrpcvr

β j \beta_j βj 表示冷启动时单次转化的价值(设为 2 b i 2b_i 2bi)

α T \alpha T αT 冷启动成功的阈值(设为10)

问题建模

m a x V ( y s , j ) = ∑ s ≤ t − 1 ∑ j ∈ A c v t , i , j ^ ∗ b j ∗ y s , j maxV(y_{s,j})=\sum_{s\leq t-1}\sum_{j\in A}\hat{cv_{t,i,j}}*b_j*y_{s,j} maxV(ys,j)=st1jAcvt,i,j^bjys,j
+ ∑ j ∈ A β j ∗ m i n { ( ∑ s ∈ t − 1 c v t , i , j ^ ∗ y s , j ) , α ( t − 1 ) } +\sum_{j\in A}\beta_j * min\{(\sum_{s\in t-1}\hat{cv_{t,i,j}}*y_{s,j}),\alpha(t-1) \} +jAβjmin{ (st1cvt,i,j^ys,j),α(t1)}

其中第一项里面其实就是 p c t c v r ∗ c p a ∗ i s S h o w pctcvr*cpa*isShow pctcvrcpaisShow,也就是ecpm。

第二项是取当前转化数 ∑ s ∈ t − 1 c v t , i , j ^ ∗ y s , j \sum_{s\in t-1}\hat{cv_{t,i,j}}*y_{s,j} st1cvt,i,j^y

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值