本篇文章主要介绍三种损失函数,pointwise、pairwise、listwise。
1. 单点法(Pointwise)
释义
Pointwise 仅考虑单个query和document的关系,会把将问题转化为多分类或回归问题,对于分类问题,正负例可以通过用户的点击来构造。
示例
对于如下数据,我们可以使用二分类训练模型,数据之间没有影响关系。

缺点
- Pointwise 完全从单文档的分类角度计算,没有考虑文档之间的相对顺序。所有正样本之间的相关性,是不会考虑(比如用户搜索「刘亦菲」,「刘亦菲百度百科」要好于「刘亦菲已出道10年」,但是point wise却无法分别),同样所有的负样本之间的相关性也是不会考虑的。然而排序追求的是排序结果,并不要求精确打分。
- 损失函数中没有引入url排序的位置信息,因此,损失函数可能会过多强调那些不重要的结果,即那些排序在后面对用户体验影响小的结果。

本文详述排序问题中的三种主要损失函数:Pointwise、Pairwise和Listwise。Pointwise将排序简化为分类或回归问题,忽视文档间相对顺序;Pairwise通过两两比较改进,但仍存在与实际排序效果不符的问题;Listwise直接优化NDCG等指标,但训练复杂度高,未充分利用位置信息。
订阅专栏 解锁全文
72

被折叠的 条评论
为什么被折叠?



