NIPS2022|南京大学提出基于点击后行为的广义延迟反馈模型

Generalized Delayed Feedback Model with Post-Click Information in Recommender Systems

Jia-Qi Yang De-Chuan Zhan

Nanjing University

https://proceedings.neurips.cc/paper_files/paper/2022/file/a7f90da65dd41d699d00e95700e6fa1e-Paper-Conference.pdf

转化率预估(比如预测某个用户购买某个商品的概率)在机器学习推荐系统中是一个基本问题。但是,真实的转化样本有时很长时间才能返回,这就破坏了推荐系统的时间轴。

先作利用较早的转化来缓解延迟反馈的问题。这篇文章指出,点击后的用户行为对转化率预估来说也是有用信息,并且可以提升时间抽的连贯性。

作者们提出一种广义延迟反馈模型,GDFM,同时利用点击后行为,并且将较早转化当做随机点击后信息,这样就可以高效地流式训练GDFM。基于GDFM,作者们还建立了一种新的视角,即延迟反馈带来的性能差距,这种差距可以归结于时序差距和采样差距。

基于分析,作者们提出利用时序距离和样本复杂度来衡量点击后信息的质量。训练目标通过突出信息量大和及时的信号来重新加权。

作者们在公开数据集验证了以上分析,实验结果表明了作者们所提方法的有效性。

点击后行为(如加购物车)相对转化的延迟要短很多

67826439ad2b3faae4fc77a45ff215c4.png

这篇文章的主要贡献如下

8b21de2040cf6e61903c3e78a4ad9592.png

不同情形下的目标函数对比如下

91bcff47d1730d0c0ebd1ba8d7961bdc.png

网络结构图示如下

ee3125b23c0464e699fa65d67bc5f7d7.png

交叉熵通常会随时间增长而增加,加购物车->购买的条件分布比转化率相对稳定

1c4f92f301aa38f9d81b72196b230c6f.png

GDFM流式训练以及权重更新算法伪代码如下

e039065b945a8e3caaa26e23518eea39.png

流式评估方案如下

2e9acfca67f8dfc208d382a85f7b2535.png

实现细节简介如下

b7b6003c6ea32984e074a250497c4664.png

几种方法的效果对比如下

80955f1b5c65c3ccc79552fbdccfbf42.png

不同超参数对模型效果影响如下

0996c813e1423fa262096c1b16e2129a.png

代码链接

https://github.com/ThyrixYang/gdfm_nips22


              aa38f2a312466833160728e9d67ffd12.png我是分割线f6bc1bd65eee7f96b9636c3215785b7e.png


您可能感兴趣

SIGIR2019|中科院联合清华提出基于ID嵌入Meta-Embedding算法优化冷启动广告

KDD2021|华为提出对偶图增强embedding神经网络DG-ENN用于CTR预估

KDD2021|因果模型在实时竞价重复曝光次数中的应用

雅虎联合阿里提出转化率预估实用框架并用于在线展示广告

IJCAI2020|京东联合香港理工提出基于点击校准的注意力模型用于时延归因转化率预估

WSDM2022|阿里联合中科院提出特征协同作用网络CAN用于点击率预估(已开源)

WSDM2022|阿里提出合约广告自适应统一分配框架AUAF(已开源)

ICDM2019|阿里提出大规模个性化分发实时平滑算法并用于合约展示广告

微软提出实时竞价算法并用于效果展示广告分配

淘宝展示广告中的优化点击成本算法

在线定向广告中的预算控制算法

KDD2021|清华联合雅虎|斯坦福大学|纽约大学提出竞价隐藏算法MEOW

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值