相关性搜索：利用Solr与Elasticsearch创建智能应用3

最新推荐文章于 2024-07-27 20:19:46 发布

原创最新推荐文章于 2024-07-27 20:19:46 发布 · 427 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

搜索专栏收录该内容

9 篇文章

订阅专栏

本文探讨了如何使用Elasticsearch和Python实现对TMDB数据集的高效搜索，通过重构索引和利用QueryDSL来提高搜索质量。文章深入解析了TF-IDF、多字段搜索和排名函数的构建，以及如何通过用户反馈调整相关性函数，最终设计出以相关性为核心的应用。

部署运行你感兴趣的模型镜像

三、调试我们的第一个相关性问题

使用Elasticsearch

TMDB数据集在https://github.com/o19s/relevant-search-book中tmdb.json

python实现函数

reindex函数，重建Elasticsearch索引，并放入其中。

Query DSL领域特定查询语言

TF-IDF

四、驾驭token

文本分析所生成的token不仅代表查询的特征，也代表文档的特征

带着意图和语义来进行分析，会极大地提升搜索的相关性。

五、多字段搜索基础

排名函数

对于多个字段的评价--即多个信号---需要被合并成一个总的相关性评价才行，这样才能平衡所有对用户或业务而言的重要因素。这就是排名函数的目标。

源数据

六、以词为中心的搜索

七、调整相关性函数

构造排名函数

八、提供相关性反馈

引导用户搜索

九、设计以相关性为核心的搜索应用

十一、语义和个性化搜索

引入推荐的概念。

主要的不同之处在于，这里并不是只从文档中提取信息，我们还会将用户本身看作一种新的信息来源。

您可能感兴趣的与本文相关的镜像

Python3.8

Python3.8

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。