es 的match query底层原理

最新推荐文章于 2023-05-09 12:53:49 发布

weixin_30302609

最新推荐文章于 2023-05-09 12:53:49 发布

阅读量500

点赞数

CC 4.0 BY-SA版权

文章标签： java 大数据

原文链接：http://www.cnblogs.com/parent-absent-son/p/11065276.html

博客介绍了match query底层会自动转换为term+should/must方式，并进行实例剖析，包括普通match转换为term+should、operator：and转换为term+must以及minimum_should_match的转换。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、知识点：match query底层会自动转换为term+should/must方式

2、实例剖析

（1）普通match如何转换为term+should

{
  "match" : {"title" : "java elasticsearch"}
}

ES会自动给我们转换为如下

{
  "bool" : {
    "should" : [
        {"term" : {"title" : "java"}},
        {"term" : {"title" : "elasticsearch"}}
    ]
  }
}

（2）operator：and如何转换为term+must

{
  "match" : {
    "title" : {
       "query" : "java elasticsearch",
       "operator" : and
    }
  }
}

{
  "bool" : {
    "must" : [
       { "term": { "title": "java" }},
       { "term": { "title": "elasticsearch"   }}
    ]
  }
}

（3）minimum_should_match如何转换

{
  "match" : {
    "title" : {
      "query" : "java elasticsearch hadoop spark",
      "minimum_should_match" : "75%"
    }
  }
}

{
  "bool" : {
    "should" : [
      {"term" : {"title" : "java"}},
      {"term" : {"title" : "elasticsearch"}},
      {"term" : {"title" : "hadoop"}},
      {"term" : {"title" : "spark"}}
    ],
    "minimum_should_match" : 3
  }
}

转自于：https://www.jianshu.com/p/3c4f98bffb34

转载于:https://www.cnblogs.com/parent-absent-son/p/11065276.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30302609

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【实战ES】实战 Elasticsearch：快速上手与深度实践-3.3.3缓存机制（Query Cache、Request Cache）

kngines

03-07

2304

【实战ES】实战 Elasticsearch：快速上手与深度实践-3.3.3缓存机制（Query Cache、Request Cache）

ElasticSearch term和match查询机制解析和隐藏的查询问题

Time_Travel的博客

05-06

4209

2. 关于默认分析使用term查询的问题之前说过es的默认分析器会讲中文拆分成一个个的单个汉子，搜索条件“内科”会被分析为“内”和“科”，从而进行搜索。而对于搜索我们常用的match搜索类似于数据库的模糊查询，term搜索为精确查询。使用的时候会出现以下情况： 2.1 场景默认不对索引下的字段进行mapping操作时，使用的是默认分析器，假设有如下数据内容：内科内一科内...

参与评论您还未登录，请先登录后发表或查看评论

es的query关键字中的match子关键字匹配查询，中文分词器（ik_smart 简易分词、ik_max_word 尽最大可能分词）

Hiber12的博客

12-18

2802

1、先了解一下es的语法语句关键字 2、最常用的，query关键字查询，query下还有match子关键字（匹配的意思） GET movie_index/movie/_search { "query": { "match": { "name": "red" } } } 查询name字段带有red的，查到总共2条结果！ 3、上面插入和查询的都是英文，那么要让es识别我们的中文，怎么办？就是要让他做到分词处理，比如：红海行动，要让他分成：红海、行动才行的。这里可以让他先分析一

ES match query

weixin_43918355的博客

06-29

2733

使用term query的弊端 GET books/_search { "query": { "term": { "title": { "value": "java编程" } } } } term query是完全匹配目标内容分词后的词项, 由于所有文档的title进行分词后都没有 ‘java编程’ 这个分词这个时候就需要使用 match query 使用match query GET books/_search { "query":

要搞懂 Elasticsearch Match Query，看这篇就够了

不见其长，日有所长

03-28

3705

1. 前言 Match Query 是最常用的 Full Text Query 。无论需要查询什么字段， match 查询都应该会是首选的查询方式。它既能处理全文字段，又能处理精确字段。 2. 构建示例为了能够在后面能深入理解 Match Query 中的各个属性的意义，我们先构建一个 index 示例(有兴趣的同学只要将下面字段粘贴到 sense 中就可以创建)。 PUT matchtest ...

ElasticSearch [三] query 查询 match

qq_26239917的博客

10-17

337

match 关键字匹配在 document 搜索相关的记录

es的query查询(term,prefix,exists,match，matchprase,range)

talen_hx的博客

12-25

3744

//查询前缀包含的内容 POST /products/_search { "query": { "prefix": { "desc.keyword": { "value": "iP" } } } } POST /products/_search { "query": { "term": { "productID.keyword": "XHDK-A-1293-#fJ3" } } } //不查询为空的数据 .

bool查询原理 es_ElasticSearch搜索底层基础原理总结

weixin_39931101的博客

12-18

298

目录：1._search结果分析2.multi-index和multi-type3.分页查询与deep paging4.query DSL和query string5.mapping6.倒排索引和正排索引(doc value)7、分词器8.exact value和full text09.建立索引10.search api11.document相关度评分DF&IDF算法12.搜索相关参数13...

ElasticSearch底层原理简析

u013465194的博客

10-23

3973

1.ElasticSearch简述 ElastiaSearch(以下简称ES)是一个基于Lucene的搜索服务器，它提供了一个分布式多用户能力的全文搜索引擎，支持RESTful web接口。Elasticsearch是用Java开发的，并作为Apache许可条款下的开放源码发布，是当前流行的企业级搜索引擎。ES设计用于云计算中，能够进行实时搜索，支持PB级搜索，具有稳定，可靠，快速，安装使用方便等...

Elasticsearch 写入和查询优化底层原理

zhangCheng的博客

06-12

849

一、Elasticsearch 写入原理二、es 写入涉及到的概念三、写入的特性优化方案一: 优化方案二: 五、es优化1、写优化： 2、读优化

Elastic Search之——全文检索函数QUERY()和MATCH()

wh4326的博客

01-23

2920

一、简介 MATCH()、QUERY()函数分别为ES DSL原生查询multi_match、query_string的变种，区别在于前者是函数，作用于ES SQL，方便用户以ES SQL的方式对数据进行全文检索；后者是ES DSL原生查询的全文搜索谓词，具体使用示例可见ES 官网。 multi_match query_steing MATCH()和QUERY() 二、使用具体使用示例这里不做详细记录，官网上介绍的很详细。这边主要介绍QUERY()和MATCH()在使用上的区别 1.上面也有介绍到，

ElasticSearch 查询 match 无法精确查找 match用term代替

03-20

2626

本人做项目的时候出现的一个小问题，记录一下 ElasticSearch 查询 match和term的区别有时候我们需要按条件精确查找，比如sql条件的ItemCode='ABC' 在ElasticSearch中如果使用match的话，会把ItemCode字段包含ABC的内容查出来，而我的需求是只想差等于ABC的内容，这时候我们就可以直接把match用term代替，完美解决了这个问题 {...

ElasticSearch中查询语句用法（match、match_phrase、multi_match、query_string）

热门推荐

IT之一小佬的博客

04-16

1万+

ElasticSearch中查询语句用法（match、match_phrase、multi_match、query_string）

ElasticSearch中minimum_should_match理解

weixin_42638762的博客

07-15

3585

elasticsearch中的minimum_should_match理解

es 基于match_phrase/fuzzy的模糊匹配原理及使用

weixin_30760895的博客

03-21

1386

[版权声明]:本文章由danvid发布于http://danvid.cnblogs.com/，如需转载或部分使用请注明出处　　　　在业务中经常会遇到类似数据库的"like"的模糊匹配需求，而es基于分词的全文检索也是有类似的功能，这个就是短语匹配match_phrase，但往往业务需求都不是那么简单，他想要有like的功能，又要允许有一定的容错（就是我搜索"东方宾馆"时，"广州花园宾馆酒店...

ES 布尔查询中 minimum_should_match 参数使用避坑

Elastic开源社区

05-09

4973

在 Elasticsearch (ES) 中，布尔查询（Boolean Query）是一种查询类型，它允许你组合多个查询子句以控制搜索结果的匹配逻辑。minimum_should_match 是布尔查询中一个重要的参数，用于指定至少应该匹配的子句数量。minimum_should_match 的值可以是一个具体的数字，也可以是一个百分比。它的具体含义取决于查询中的 should 子句的数量。当 minimum_should_match 是一个整数时，它表示至少需要匹配的 should 子句数量。

【Elasticsearch7.11】关于elasticsearch(es)中查询minimum_should_match 参数的记录

qq_31286957的博客

01-31

748

2、分词器直接影响分词结果，可以设置不同的搜索分词器和文档分词器(或者通过fields 实现多分词器对文档分词，在搜索时指定分词器),如下。3、通过 _analyze 命令查看分词结果，根据搜索内容分词和文档内容分词结果匹配是否至少匹配上2个不同的词语。1、搜索分词和文档分词匹配时，重复词语算作一个词语，也就是至少匹配到查询分词词语中的2个不同的词语。直接上结论：以"minimum_should_match" ：“2” 为例。以下是验证结论 1 ，结论2 3 都是实际使用中的一些技巧。

四 match的底层实现转化

一朵的专栏

08-28

392

1、普通match如何转换为term+should { "match": { "title": "java elasticsearch"} } 使用诸如上面的match query进行多值搜索的时候，es会在底层自动将这个match query转换为bool的语法 bool should，指定多个搜索词，同时使用term query { "bool": { "should...

ES-- match查询

chbxw

03-31

9727

2.2、match查询 match查询属于高层查询，会根据你查询的字段的类型不一致，采用不同的查询方式。如果查询的是日期或者数值的字段，他会自动将你的字符串查询内容转换成日期或者数值对待；如果查询的内容是一个不能被分词的字段(keyword).match查询不会对你的指定查询关键字进行分词；如果查询的内容是一个可以分词的字段(text)，match会将你指定的查询内容根据一定的方式去分词，然后去分词库中匹配指定的内容。总而言之：match查询，实际底层就是多个term查询，将多个term查询的结

es中like和match 查询速度

最新发布

03-29

<think>嗯，用户想比较Elasticsearch中like查询和match查询的性能。首先，我需要回忆一下这两种查询的区别。记得like查询属于模糊查询的一种，底层用的是Wildcard Query，也就是通配符查询。这种查询在处理时可能需要扫描大量的倒排索引，特别是当通配符在开头的时候，比如“*abc”，这样会导致性能问题，因为无法有效利用索引结构[^1]。而match查询则是基于分词后的词项进行精确匹配，可以利用倒排索引的高效检索，尤其是在有合适分析器和分词策略的情况下，性能通常会更好[^2]。用户可能在使用like查询时遇到了性能问题，所以想了解是否有更优的替代方案。需要详细解释两者的工作原理，以及为什么性能会有差异。比如，Wildcard Query需要遍历所有可能的词项，而match查询直接查找分词后的结果，减少了不必要的扫描。另外，用户可能想知道具体的优化建议。例如，避免在like查询中使用前导通配符，或者改用match_phrase_prefix来实现前缀匹配，这样可以利用索引的优势。同时，索引设计也很重要，比如使用ngram分词器来优化部分匹配场景。还要考虑实际应用中的测试方法，建议用户在自己的数据集上进行基准测试，因为数据量和结构的不同会影响查询性能。此外，引用相关的文档或最佳实践来支持这些建议，比如Elasticsearch官方对通配符查询的警告，以及推荐使用match查询的情况[^1]。最后，确保回答结构清晰，分点说明差异、性能影响和优化建议，帮助用户全面理解问题，并提供可行的解决方案。</think>关于Elasticsearch中`like`查询（通配符查询）和`match`查询的性能对比，以下是关键分析： --- ### 一、查询类型与底层实现差异 1. **`like`查询（通配符查询）** - 属于`wildcard`查询，支持`*`和`?`通配符，例如`"query": "elast*"` - **性能瓶颈**：需要遍历倒排索引中的词项列表，尤其是`*`出现在词项开头时（如`*search`）会触发全索引扫描，时间复杂度为$O(n)$ - **资源消耗**：高内存占用（需缓存候选词项）+ 高CPU计算（正则匹配） 2. **`match`查询** - 基于分词后的词项进行精确匹配，例如`"query": "elasticsearch"`会被拆分为词项列表 - **性能优势**：直接利用倒排索引的哈希表定位词项，时间复杂度接近$O(1)$ - **优化机制**：支持分词策略（如`standard`/`keyword`）、相关性评分优化 --- ### 二、性能对比指标 | 查询类型 | 响应时间 | CPU占用 | 适用场景 | |----------------|----------|---------|------------------------| | `wildcard` | 高 | 高 | 模糊匹配、无分词字段 | | `match` | 低 | 低 | 分词后的精确/近似匹配 | --- ### 三、优化建议 1. **避免`wildcard`查询的滥用** - 禁止前导通配符（如`*elastic`），改用`match_phrase_prefix`实现前缀匹配 - 对固定模式查询使用`keyword`类型字段+`edge_ngram`分词器 2. **`match`查询增强** - 结合`fuzziness`参数实现模糊匹配（如拼写纠错） - 使用`synonyms`同义词词典扩展匹配范围 3. **索引设计优化** - 对需要模糊查询的字段单独设置`fields`多字段类型 - 采用`index_prefixes`参数预生成前缀词项（Elasticsearch 7.0+） --- ### 四、验证方法建议通过`_profile`API进行查询执行分析： ```json POST /index/_search { "profile": true, "query": { "wildcard": { "field": "*search" } } } ``` 观察返回结果中的`time_in_nanos`和`breakdown`字段，对比两种查询的实际执行耗时。 ---