本来想写蚂蚁金服运用强化学习做推荐的文章《Generative Adversarial User Model for Reinforcement Learning Based Recommendation System》,但这不快放假了嘛,思考再三还是决定写点简单的吧。这次来谈谈负采样点击率修正的那些事。
1、负采样点击率修正
在广告点击率预估中,正负样本的比例是很不平衡的,所以有时候需要进行一定程度的负采样,即对负样本进行一定比例的采样,降低正负样本不平衡的程度,一定程度上提高模型预估的精度。
假设整体样本中的正负样本比例为1:3(当然实际上会比这更不平衡的多,此处仅仅是举个例子),由于假设训练集和测试集中的样本是独立同分布的,那么由不采样的数据训练得到的模型,在测试集上的点击率平均值约为0.25。
再假设样本中存在三种广告的样本A、B和C,其比例为50:30:20,而各自的正样本分别占30%、20%和20%,如下图所示:

这样,在测试集中,对三种广告的点击率预估值的平均值也接近0.3、0.2和0.2。此时我们对负样本进行一定程度的采样,假设采样率为1/3,这样能使整体上正负