排序模型

最新推荐文章于 2025-05-31 10:52:21 发布

转载最新推荐文章于 2025-05-31 10:52:21 发布 · 478 阅读

文章标签：

#人工智能

传统的排序模型主要分为相关性和重要性两大类

相关性：Bool model，VSM，Language model

重要性：PageRank、TrustRank

1.Bool model

Query为逻辑表达式，即“与/或/非”，相似性通过布尔代数运算判定，只有相关于不相关

2.VSM

是一种表示文档的代数模型。文档映射为t维特征向量，每维特征的权重主要有TF-IDF等多个变种。

相似度计算主要是余弦相似度

3.概率检索模型

BM25将Query分解成多个语素，综合考虑每个语素的二元独立模型（与IDF等价）、语素在文档中的权值、语素在Query中的权值，求和。

4.Language model

为每个文档建立不同的语言模型，判断由文档生成Query的可能性有多大，然后按照这种生成概率由高到低排序，作为搜索结果。

数据稀疏问题：很多查询词在文档中没有出现，导致概率为0，检索失效

解决：用背景概率做数据平滑，某个单次的背景概率就是这个单次出现的次数除以文档集合的单次总数

综上，文档生成查询概率的计算公式为每个查询词的文档语言模型+平滑的文档集合语言模型，求积

改进：HMM、相关模型、翻译模型

5.PageRank

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_33737134

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

task05

bw666的博客

12-05

374

task05 排序模型+模型融合排序模型使用了召回操作后已经缩减了问题规模，每个用户都有候选集，并基于召回的候选集构建了与用户历史相关的特征，以及用户本身的属性特征，文章本省的属性特征，以及用户与文章之间的特征，下面就是使用机器学习模型来对构造好的特征进行学习，然后对测试集进行预测，得到测试集中的每个候选集用户点击的概率，返回点击概率最大的topk个文章，作为最终的结果。三个有代表性的排序模型：LGB的排序模型、LGB的分类模型、深度学习的分类模型DIN 两种经典的模型集成的方法：输出结果加权融合、S

【大模型开发】传统向量模型 vs 重排序模型：原理、实现与应用

m0_54007171的博客

09-07

1918

在自然语言处理（NLP）和信息检索（IR）中，**传统向量模型**和**重排序模型**是两种常见的技术。它们在不同的应用场景中扮演了重要角色，尤其是在搜索、问答系统等需要排序和检索的任务中。本文旨在对比这两种模型的原理与实现，帮助读者理解其各自的优缺点，并展示相关代码和实战应用。

参与评论您还未登录，请先登录后发表或查看评论

Datawhale 实践项目天池赛中零基础入门推荐系统 Task05：排序模型+模型融合笔记[让我看看]

微信公众号（年更选手）：数据闲逛人 | Github开源项目：数分/数挖study路线 https://github.com/jc-dian/python_data_analysis

12-04

634

文章目录1. 排序模型1.1 读取排序特征1.2 返回排序后的结果 1. 排序模型通过召回的操作，我们已经进行了问题规模的缩减，对于每个用户，选择出了N篇文章作为了候选集，并基于召回的候选集构建了与用户历史相关的特征，以及用户本身的属性特征，文章本省的属性特征，以及用户与文章之间的特征，下面就是使用机器学习模型来对构造好的特征进行学习，然后对测试集进行预测，得到测试集中的每个候选集用户点击的概率，返回点击概率最大的topk个文章，作为最终的结果。排序阶段选择了三个比较有代表性的排序模型，它们分别是

如何构建高效的搜索领域排序模型

专注搜索引擎技术

05-31

591

排序模型：DIN、DINE、DSIN

Ajdidfj的博客

03-07

1934

目录DIN输入输出：与transformer注意力机制的区别与联系：DINE改善DIN输入：DSIN动机：LGB适用与精排，论文： Deep Interest Network for Click-Through Rate PredictionDIN模型提出的动机是利用target attention的方法，进行加权pooling，它为历史行为的物品和当前推荐物品计算一个attention score，然后加权pooling，这样的方法更能体现用户兴趣多样性。DIN模型，增加了注意力机制，模型的创新点或者解决

排序模型（Learning to Rank）

pljnb的博客

04-21

1290

排序模型旨在解决。核心挑战：根据上下文特征，将最相关/最有价值的内容排列在更靠前的位置。

知乎搜索排序模型的探索实践.pdf

06-03

知乎搜索排序模型的探索实践是互联网在线搜索领域中的一项重要研究课题，它关注的是如何优化搜索引擎算法，以提供更加相关、精准的搜索结果。在这篇实践报告中，涉及的技术和概念涵盖了搜索排序模型的核心要素，其中...

Fibinet排序模型代码

最新发布

07-03

FiBiNet排序模型代码是华为在2019年提出的一种先进的推荐系统排序模型，其核心创新之处在于引入了特征重要性（Feature Importance）机制。这个机制主要是通过量化不同特征对预测结果的贡献程度，增强模型对关键特征...

算法全栈之路排序模型源码

01-19

"算法全栈之路排序模型源码"这一标题意味着本文件是关于排序算法的教学和实践资料，很可能包含了多种排序算法的实现代码。源码的提供能够使得学习者更直观地理解和掌握各种排序算法的内部逻辑和执行过程。对于全栈...

AutoML在推荐系统排序模型的探索与应用.pdf

10-14

随着技术的发展，自动机器学习（AutoML）在推荐系统的排序模型中扮演了越来越重要的角色，旨在优化模型性能，减少人工特征工程的工作量。本文将探讨AutoML在推荐系统排序模型中的应用及其发展趋势。首先，传统的...

公共交通方式转移价格的排序选择模型 (2011年)

05-26

通过意愿调查法对公共交通出行者的出行意向进行调查，研究了不同出行时间比下常规公共交通出行者转向轨道交通的意愿价格阈值影响因素及规律.基于排序选择模型，分别建立了基于排序Probit和排序Logil的公共交通内部方式转移价格阈值模型，并对模型进行局部效应分析.结果表明：性别、职业、收入、公交出行时间、公交出行费用及地铁与公交出行时间比对公共交通内部方式转移意愿价格阈值具有显著影响；常规公交费用支出每增加1元，其向轨道交通转移时的票价阈值为3、4、5、6元的概率分别改变-5.03％、1.07％、2.32％、1

排序模型总结及应用

Vensmallzeng的博客

04-08

2013

在酒店业务中，当用户打开微信中同程旅行小程序/艺龙APP/同程APP等，各式各样的酒店玲玲满目，而让用户将所有酒店浏览完再去选酒店下单已不太可能，因为用户一般也就查看前几页，如果找不到满意的酒店则退出，从而造成流单。因此如何对酒店进行排序使得用户感兴趣的酒店尽量排在前面从而提高交易匹配效率是同程旅行平台重点研究的方向。

排序常用模型

MaYingColdPlay的博客

08-16

1028

无

排序模型入门详解（未完待续）

lankuohsing的博客

10-31

6257

排序模型入门详解文章目录排序模型入门详解1. 排序模型的应用场景point-wise排序模型pair-wise排序模型Ranknet https://yq.aliyun.com/articles/18 1. 排序模型的应用场景当商家需要向用户提供多个商品供选择时，往往会遇到这个问题：如何将商品按照一定的顺序呈现给用户，以便使用户能够尽可能地完成购买流程？这就涉及到对商品的排序，用到的模型称排...

排序模型（learning to rank）发展史（偏推荐系统

对算法理论、算法工程落地、大数据工具等感兴趣

06-30

2576

「排序」是一个非常业务化的任务，其实践场景也多为搜索、广告、推荐，被用于解决排序任务的模型也被人一统称作了「排序模型」，但其实「排序模型」也是「普通模型」，只不过或多或少在业务层面针对排序做了一些针对。观察每一类算法模型的发展，最重要的不是事无巨细的记住所有迭代模型的细节，而是明白每一次发生迭代，每一次技术革新，都或多或少解决了上一代模型存在的某一些问题。记住他们迭代的契机，才是通晓了整个历史。这次就来梳理一下排序模型的发展史。提起推荐系统中的算法，最经典的莫过于协同过滤。协同顾虑最早可以追溯到 1992

排序模型-wide & deep learn

weixin_40207586的博客

02-07

212

文章目录排序模型-wide & deep learnTFrecord 保存数据使用wide & deep 深度模型进行预测排序模型-wide & deep learn TFrecord 保存数据 mport tensorflow as tf def write_to_tfrecords(click_batch, feature_batch): """ 将数据存进tfrecords，方便管理每个样本的属性 :param image_ba

排序模型对比

qfikh的博客

03-26

782

LR 可以视作单层单节点的“DNN”, 是一种宽而不深的结构，能够处理高纬度稀疏问题，。模型优点是简单、高效、可控性好，模型可解释: 所有的特征直接作用在最后的输出结果上但是效果的好坏直接取决于特征工程的程度，需要非常精细的连续型、离散型、时间型等特征处理及特征组合。通常通过正则化等方式控制过拟合。Ref:https://tech.meituan.com/201...

RAG检索增强之Reranker重排序模型详解！

xx_nm98的博客

03-09

5104

ReRanker模型是对RAG检索返回的结果进行重新排序的模型。也就是下图所示中2nd Retrieval的模型。具体来说，ReRanker模型在RAG Pipeline中扮演着第二阶段的角色，即在初始检索步骤之后，对检索出的文档块chunks进行重新排序，以确保相关的文档块优先被传递给LLM进行处理。

推荐系统排序模型

03-08