
信息检索
信息检索相关
隔壁的NLP小哥
积跬步,至千里
展开
-
信息检索(IR)—排序学习技术
信息检索(IR)—排序学习技术1 引入回顾搜索引擎的发展历史,其发展的过程如下图所示:在之前的文章中,我们介绍了基于链接分析的搜索引擎,下面我们来介绍基于排序学习的搜索引擎中的排序学习技术。1.1 基本概念和基本过程排序学习是指应用有监督学习的机制训练排序模型来用于信息的表示。 其基本的过程如下图所示:1.2 排序学习的基本分类Pointwise单文档方法:用类别号表示排序的相...原创 2020-05-08 13:03:28 · 2304 阅读 · 1 评论 -
信息检索(IR)—链接分析
信息检索(IR)—链接分析1 超链接介绍1.1 网页中的超链接链接反应的是网页之间形成的“参考”、“引用”和推荐的关系。可以合理的假设,若一篇网页被较多的其他网页连接,则它相对被人关注,其内容应该是较为重要的或者较为有用的。因此,可以认为一个网页的“入度”(指向它的网页的个数)是衡量它重要程度的一种有意义的指标,同时,网页的“出度”对分析网上信息的状况也很有意义,因此可以使用这两个指标来衡量...原创 2020-05-08 11:57:33 · 1218 阅读 · 0 评论 -
信息检索(IR)—信息检索模型(二)
信息检索(IR)—信息检索模型(二)接上一篇文章:信息检索(IR)—信息检索模型(一)1 扩展的布尔模型1.1 模型引入在之前的文章中,我们介绍了信息检索中的布尔模型,在布尔模型中我们基于关键词的布尔表达式进行匹配,在匹配的过程的中,我们只能够保证关键词的逻辑关系是否符合布尔表达式,但是确不能确定无法区别出结果的差异性。为了体现出返回结果的差异性,我们这里使用布尔模型和向量空间模...原创 2020-05-07 22:05:58 · 3412 阅读 · 0 评论 -
信息检索(IR)—信息检索模型(一)
信息检索(IR)—信息检索模型(一)1. 信息检索模型的概念和分类1.1 信息检索模型的概念信息检索模型是一个四元组[D,Q,F,R(qi,dj)][D,Q,F,R(q_i,d_j)][D,Q,F,R(qi,dj)]所组成,其中D:表示文档集,Q表示用户的查询集合,F为文档表示,查询表示和它们之间关系的模型框架。R(qi,dj)R(q_i,d_j)R(qi,dj)表示排序函数,给定q...原创 2020-05-07 14:02:22 · 9654 阅读 · 0 评论 -
信息检索(IR)——索引与检索
信息检索(IR)——索引与检索1. 索引在介绍这部分内容之前,我们先来回顾一下信息检索系统的基本架构:1.1 索引的作用首先,当用户提交一个query的时候,我们考虑一下,应该如何生成结果?如果直接对文档库中的每一篇文档进行扫描,当文档库特别大或者文档本身就特别大的时候,这种扫描的过程本身就是费时费力的,为了提高检索速度,我们肯定是需要对文档库中的文档进行预处理,这个时候就需要索引结构。...原创 2020-05-07 11:34:36 · 4194 阅读 · 0 评论 -
信息检索(IR)—评价指标(二)
信息检索(IR)—评价指标(二)接上一篇文章:信息检索(IR)—评价指标(一)原创 2020-05-05 15:16:52 · 3978 阅读 · 0 评论 -
信息检索(IR)—评价指标(一)
信息检索(IR)—评价指标(一)1. 信息检索基本介绍1.1. 信息检索任务1.1.1 任务描述信息检索是指在给定自然语言的文档(或者图片,视频等多媒体)集合和用户的查询(query)的条件,通过系统的处理,返回与query相关的经过排序的文档(或者多媒体)的文档子集。1.1.2 query的基本形式根据上述的概念描述,我们可以知道query的基本形式可以包括关键词,带有布尔操作的关键...原创 2020-05-05 14:13:45 · 4089 阅读 · 1 评论