相关性搜索:利用Solr与Elasticsearch创建智能应用3

本文探讨了如何使用Elasticsearch和Python实现对TMDB数据集的高效搜索,通过重构索引和利用QueryDSL来提高搜索质量。文章深入解析了TF-IDF、多字段搜索和排名函数的构建,以及如何通过用户反馈调整相关性函数,最终设计出以相关性为核心的应用。
部署运行你感兴趣的模型镜像

三、调试我们的第一个相关性问题

使用Elasticsearch

TMDB数据集在https://github.com/o19s/relevant-search-book中tmdb.json

python实现函数

reindex函数,重建Elasticsearch索引,并放入其中。

Query DSL领域特定查询语言

TF-IDF

四、驾驭token

文本分析所生成的token不仅代表查询的特征,也代表文档的特征

带着意图和语义来进行分析,会极大地提升搜索的相关性。

五、多字段搜索基础

排名函数

对于多个字段的评价--即多个信号---需要被合并成一个总的相关性评价才行,这样才能平衡所有对用户或业务而言的重要因素。这就是排名函数的目标。

源数据

六、以词为中心的搜索

七、调整相关性函数

构造排名函数

八、提供相关性反馈

引导用户搜索

九、设计以相关性为核心的搜索应用

十一、语义和个性化搜索

引入推荐的概念。

主要的不同之处在于,这里并不是只从文档中提取信息,我们还会将用户本身看作一种新的信息来源。

 

您可能感兴趣的与本文相关的镜像

Python3.8

Python3.8

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值