排序学习PointWise、PairWise、ListWise

最新推荐文章于 2024-11-25 00:29:56 发布

原创最新推荐文章于 2024-11-25 00:29:56 发布 · 1.5k 阅读

1 ·

CC 4.0 BY-SA版权

机器学习专栏收录该内容

2 篇文章

订阅专栏

本文深入探讨排序学习在信息检索中的应用，包括PointWise、PairWise和ListWise三种方法，及其各自的优缺点。PointWise方法将排序视为分类问题，PairWise关注文档相对次序，而ListWise则考虑整体列表排序。文章还提供了具体实例说明。

视频没有讲清楚，后面写的不好，还是贴上别人的博客吧，讲的很清楚：
https://blog.youkuaiyun.com/anshuai_aw1/article/details/86018105
方便以后自己查阅

排序学习 —— 通过机器学习的方法帮助排序
最早用于信息检索，比如给定搜索的内容，返回相应的文档，那么如何决定返回文档的顺序呢？这就需要排序学习~
常用的排序学习可以分为三种类型：**PointWise**、**PairWise**、**ListWise**
在这里插入图片描述

PointWise：

在PointWise方法下，每个item对应于一个类别，排序问题就可以被看成是一个分类问题。

一般来说，每个item会被转化成特征向量，向量里包含一些特征，比如PageRank分数，关键字出现次数等信息，将特征向量输入分类器（如SVM、逻辑回归、感知机等），就能得到一个分数，通过分数就能得到最终的排序列表。

优势：在于其直接支持已有的回归或者分类的理论和算法。
缺点：由于是分类问题，被分为同一类的文档会丢失次序信息。

例子：例子中使用了均方误差作为损失函数，实际中还可以使用交叉熵等其他loss。
在这里插入图片描述

PairWise：

核心思想：如果知道文档的相对次序，那么最终就能恢复出整个排列。比如对于文档（a，b，c），如果知道a和b、b和c、a和c之间的相对次序，那么也就知道了最终的排序。
在这里插入图片描述
下面是PointWise和PairWise的对比：

PairWise的缺陷在于，由于推导出来的是两两之间的顺序，因此很难推导出item的整体顺序。
举个例子：