elasticsearch 中文_2

最新推荐文章于 2024-04-14 16:26:27 发布

fly1056601582

最新推荐文章于 2024-04-14 16:26:27 发布

阅读量562

点赞数

CC 4.0 BY-SA版权

分类专栏： elasticsearch 文章标签： elasticsearch

本文链接：https://blog.youkuaiyun.com/fly1056601582/article/details/79353013

elasticsearch 专栏收录该内容

2 篇文章

订阅专栏

本文深入探讨了Elasticsearch中的查询和过滤语句，包括term、terms、range、exists、missing、bool过滤，match、multi_match、bool查询等，以及如何结合查询与过滤条件。同时介绍了相关性排序、排序方式和评分标准，帮助理解查询执行过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最重要的查询过滤语句

之前的那篇博客，主要是针对elasticsearch的整理。下面我个人觉得会非常实用。

term过滤

term 主要用于精确匹配哪些值，比如数字，日期，布尔值或not_analyzed的字符串
{“term”:{“age”:26}} {“term”:{“date”:”2014-09-01”}} {“term”:{“public”:true}} {“term”:{“tag”:”full_text”}}

terms过滤

terms跟term有点类似，但terms允许指定多个匹配条件。如果某个字段指定了多个值，那么稳定需要一起去匹配：
{ “terms”:{ “tag”:[“search”,”full_text”,”nosql”] } }

range过滤

range过滤允许我们按照指定方位查找一批数据：
{ “range”:{ “age”:{ “gte”:20, “lt”:30 } } }

操作符	意思
gt	大于
gte	大于等于
lt	小于
lte	小于等于

exists和missing过滤

exists和missing过滤可以用于查找稳定中是否包含指定字段或没有某个字段,类似于sql语句中is_null条件
{ “exists”:{ “field”:”titile” } }

bool过滤

bool 过滤可以用来合并多个过滤条件查询结果的布尔逻辑，它包含以下操作符：

操作符	意思
must	多个查询天剑的完全匹配相当于and
must_not	多个查询条件的相反匹配，相当于not
should	至少有一个查询条件匹配，相当于or

{ “bool”:{ “must”:{“term”:{“folder”:”inbox”}}, “must_not”:{“term”:{“tag”:”spam”}}, “should”:[ {“term”:{“starred”:true}}, {“term”:{“unread”:true}} ] } }

match_all 查询

使用match_all 可以查询到所有文档，是没有查询条件下的默认语句。

match 查询

match查询是一个标准查询，不管你需要权文博查询还是精确查询基本上都要用到它。
如果你使用match查询一个全文档字段，它会在站长查询之前用分析器先分析match一下查询字符：
{ “match”:{ “tweet”:”About Search” } }

multi_match查询

multi_match 查询允许你做match查询的基础上同时搜索多个字段：
{ “mulit_match”:{ “query”:”full text search”, “fields”:[“title”,”body”] } }

bool 查询

bool查询与bool过滤相似，用于合并多个查询子句。不同的是，bool过滤可以直接给出是否匹配成功，而bool查询要计算每一个查询子句的_score（相关性分值）

查询与过滤条件的合并

查询语句和过滤语句可以放在各自的上下文中，在elasticsearch api中我们会看到很多带有query或filter的语句。这些语句既可以包含单挑query语句，也可以包含一条filter子句。换句话说，这些语句需要首先创建一个query或filter的上下文关系。

符合查询语句可以加入其它查询子句，符合过滤语句也可以加入其它过滤子句。通常情况下，一条查询语句需要过滤语句的辅助。全文搜索除外。

所以说，查询语句可以包含过滤子句，反之亦然。以便于我们切换query或filter的上下文。这就要求我们在读懂需求的同时构造正确有效的语句。

带过滤的查询语句

过滤一条查询语句

{ “match”:{ “email”:”business opportunity” } }
然后我们让这条语句加入term过滤，在收信箱中匹配邮件：
{ “term”:{ “folder”:”inbox” } }

search API中只能保护query语句，所以我们需要用filtered来同时包含”query“和”filter“子句：

{ ”filter“:{ “query”:{“match”:{“email”:”business opportunity”}}, “filter”:{“term”:{“filder”:”index”}} } }

我们在外层再加入query的上下文：

{ ”query“:{ ... } }

单条过滤语句

在query上下文中，如果你只需要一条过滤语句，比如在匹配全部邮件的时候，你可以省略query子句
GET /_search { “query”:{ “filtered”:{ “filter”:{“term”:{“foler”:”inbox”}} } } }
如果一条查询语句没有指定查询方位，那么它默认使用match_all查询，所以上面语句的完整结果如下：
GET /_search { “query”:{ “filtered”:{ “query”:{“match_all”:{}}, “filter”:{“term”:{“folder”:”inbox”}} } } }

查询语句中的过滤

GET /_search { “query”:{ “filtered”:{ “filter”:{ “bool”:{ “must”:{“term”:{“folder”:”inbox”}}, “must_not”:{ “query”:{ “match”:{“email”:”urgent business proposal”} } } } } } } }

验证查询

查询语句可以变得非常复杂，特别是与不同的分析器与字段映射相结合后，就会有些难度。

validate API 可以验证一条查询语句是否合法。
GET /gb/tweet/_validate/query { “query”:{ ..... } }
以上请求的返回值告诉我们这条语句的是非法的
{ “valid”：false, “_shards”:{ “total”:1, “successful”:1, “failed”:0 } }

理解错误信息

相纸的语句非法的具体错误信息，需要加上explain参数：
GET /gb/tweet/_validate/query?explain ....

理解查询语句

如果合法语句的话，使用explain参数可以防护一个带有查询语句的可阅读描述，可以帮助了解查询语句在es中是如何执行的：

{ “valid”:true, “_shards”:{...}, “explanations”:[{ “index”:”us”, “valid”:true, “explanation”:”tweet:really tweet:powerful” },{ “index”:”gb”, “valid”:true, “explanation”:”tweet:really tweet:power” }] }
从返回的explanation你会看到match是如何为查询字符串”really powerful“进行查询的，首先，它被拆分成两个独立的分词分别在tweet字段中进行查询。

而且在索引us中这个两个词为really和powerful，在索引gb中被拆分成really和power。这时因为我们在索引gb中使用了english分析器。