推荐系统遇上深度学习(六十五)-负采样点击率修正的那些事

本来想写蚂蚁金服运用强化学习做推荐的文章《Generative Adversarial User Model for Reinforcement Learning Based Recommendation System》,但这不快放假了嘛,思考再三还是决定写点简单的吧。这次来谈谈负采样点击率修正的那些事。

1、负采样点击率修正

在广告点击率预估中,正负样本的比例是很不平衡的,所以有时候需要进行一定程度的负采样,即对负样本进行一定比例的采样,降低正负样本不平衡的程度,一定程度上提高模型预估的精度。

假设整体样本中的正负样本比例为1:3(当然实际上会比这更不平衡的多,此处仅仅是举个例子),由于假设训练集和测试集中的样本是独立同分布的,那么由不采样的数据训练得到的模型,在测试集上的点击率平均值约为0.25。

再假设样本中存在三种广告的样本A、B和C,其比例为50:30:20,而各自的正样本分别占30%、20%和20%,如下图所示:

这样,在测试集中,对三种广告的点击率预估值的平均值也接近0.3、0.2和0.2。此时我们对负样本进行一定程度的采样,假设采样率为1/3,这样能使整体上正负

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值