Elasticsearch 模糊查询 wildcard、regexp、prefix选型

最新推荐文章于 2025-10-11 15:36:46 发布

原创最新推荐文章于 2025-10-11 15:36:46 发布 · 3.4w 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

最新 elasticsearch 搜索技术专栏收录该内容

42 篇文章

订阅专栏

本文探讨了Elasticsearch中wildcard、regexp、prefix查询的使用场景与性能考量，特别是针对Numericdatatypes和文本类型的处理策略，以及如何通过profile语法优化查询。

之前讲过Elasticsearch 的wildcard（通配符查询）、regexp（正则查询）、prefix（前缀查询），他们都是致力于模糊搜索，然后在实际的项目中该如何选择，稍不注意就可能到很大性能问题。

使用方式这里就不再赘述了，他们都是基于词条查询，它们也需要遍历倒排索引中的词条列表来找到所有的匹配词条，然后逐个词条地收集对应的文档ID。

针对Numeric datatypes（long, integer, short, byte, double, float....）

基本上不要使用，那样做意义真的不大，另外要关注下数值类型和Term Query有重大变化的介绍。

针对文本类型（text和keyword）

这一类大概是主流需求，

当搜索字段是text类型时：由于它会分词，在执行wildcard、regexp、prefix时和es会检查字段中的每个词条，而不是整个字段。

当搜索字段是keyword类型时：在执行wildcard、regexp、prefix时和es会检查字段中整个文本

prefix查询

如果满足你的需求，前缀匹配是优于wildcard和regexp。

regexp查询和wildcard查询

避免使用一个以通配符开头的模式(比如，*foo或者正则表达式: .*foo)，运行这类查询是非常消耗资源的。

最后再提醒下，如果你想了解它的执行过程及耗时情况（优化项从这里分析），查询是添加profile语法。

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。