推荐系统遇上深度学习(六十五)-负采样点击率修正的那些事

文文学霸

于 2019-09-28 17:36:10 发布

阅读量129

点赞数

文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/abcdefg90876/article/details/130432591

版权

本来想写蚂蚁金服运用强化学习做推荐的文章《Generative Adversarial User Model for Reinforcement Learning Based Recommendation System》，但这不快放假了嘛，思考再三还是决定写点简单的吧。这次来谈谈负采样点击率修正的那些事。

1、负采样点击率修正

在广告点击率预估中，正负样本的比例是很不平衡的，所以有时候需要进行一定程度的负采样，即对负样本进行一定比例的采样，降低正负样本不平衡的程度，一定程度上提高模型预估的精度。

假设整体样本中的正负样本比例为1:3(当然实际上会比这更不平衡的多，此处仅仅是举个例子)，由于假设训练集和测试集中的样本是独立同分布的，那么由不采样的数据训练得到的模型，在测试集上的点击率平均值约为0.25。

再假设样本中存在三种广告的样本A、B和C，其比例为50:30:20，而各自的正样本分别占30%、20%和20%，如下图所示：

这样，在测试集中，对三种广告的点击率预估值的平均值也接近0.3、0.2和0.2。此时我们对负样本进行一定程度的采样，假设采样率为1/3，这样能使整体上正负

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。