RS Meet DL(76)-CVR预估中的延迟反馈问题建模-优快云博客

本文链接：https://blog.youkuaiyun.com/abcdefg90876/article/details/104471190

本文探讨在CPA计费场景下，针对转化率（CVR）预估存在的延迟反馈问题。提出了不依赖matching window的建模方法，通过建模转化行为的发生概率和转化时间间隔，解决样本标记错误和模型更新不及时的问题。文章介绍了符号定义、问题建模和优化策略，提供了一种新的处理延迟反馈的思路。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、背景介绍

在展示广告场景中，有多种多样的计费方式，如按每次展示计费CPM、按每次点击计费CPC、以及按每次转化计费CPA。但不论何种计费方式，在实时竞价的场景下，供给方（媒体）对于广告的排序基本都是采用eCPM（千次展示广告收入），那么对于CPC计费的情景，eCPM = bid * pCTR，而对于CPA计费的场景，eCPM = bid * pCTR * pCVR。可以看到，对于CPA计费的场景，需要对CTR和CVR进行准确的预估。而本文也重点关注CPA计费场景下的CVR预估问题。

但是对与转化率（Conversion Rate）的预估，有时候会存在一定的延迟反馈（delayed feedback）问题，比如看过一个商品广告，当时没有发生购买行为，过了几天按捺不住去买。对于这种存在延迟反馈的场景，在训练模型时，对于一些还没有转化的样本，我们无法确定是负样本还是有可能变成正样本。一种比较基本的做法是设定一个matching window，比如5天，如果5天内还没有发生转化，那么就会标记为负样本。

上述的做法，对于matching window的设定至关重要，如果matching window设置的较短，那么可能会有更多的样本被错误的标记为负样本，如果设置较长，那么每次更新模型，所使用的样本至少是matching window时间前的样本，这样会导致训练的模型“不新鲜”。

因此，本文提出一种不包含matching window的对延迟反馈问题建模的方法，一起学习一下。