p=c1p′−1+cp=c1p′−1+c
- c∼(0,1]c∼(0,1]: 负样本采样比例。如果正负样本都采样,采样比分别为c1,c2c1,c2, 则 c=c2/c1c=c2/c1
- p′p′:使用有采样的样本预估的ctr
- pp:修正ctr(理论真实值)
特性
- 推导方法, 可用 得到
- 对于 logistic regression,p′=11+exp(−wx)=σ(wx)p′=11+exp(−wx)=σ(wx),可直接在此函数中修正:
p=σ(wx+lnc)p=σ(wx+lnc) - 通常情况 p′p′ 值较小,在 p′→0p′→0 时有 dpdp′=cdpdp′=c,此时可近似: p=cp′p=cp′
- 相反 p′p′ 接近于 1 时,有近似:p=p′/cp=p′/c
- 函数曲线:
本文介绍了一种CTR(点击率)修正方法,通过调整正负样本的采样比例来更准确地预估点击率。该方法利用了logistic regression模型,并提出了在不同CTR值下如何进行修正的公式。
179

被折叠的 条评论
为什么被折叠?



