问题
pointwise: 预测分值可以看作点击概率。可以产生很好的校准预测值,但是会产生局部最优的ranking效果。
pairwise:预测分值代表list中的相对关系,不代表点击概率。
两种loss的结合方式下的loss 的含义并不明确。如果建模成多目标优化问题的话,两者难以融合成最终的预测,预测值无法最终用于ctr。
本文将预测值logits拆分为两个值: click-logit & non click-logits.
方法
将模型输出两维定义为: f ( x ) [ 0 ] f(x)[0] f(x)[0]和 f ( x ) [ 1 ] f(x)[1] f(x