Elasticsearch中 match、match_phrase、query_string和term的区别

(一)text字段和keyword字段的区别

以下给出一个例子:

首先建立一个索引和类型,引入一个keywork的字段:

PUT my_index
{
  "mappings": {
    "products": {
      "properties": {
        "name": {
          "type": "keyword"
        }
      }
    }
  }
}
然后查询是否有索引:

GET _cluster/state

可以看到已经创建成功:

 

添加一条数据:

POST my_index/products
{
  "name":"washing machin"
}

然后查询:

GET my_index/products/_search
{
  "query": {
    "term": {
      "name": "washing"
    }
  }
}

可以看到没有匹配到任何数据:

然后查询:

GET my_index/products/_search
{
  "query": {
    "term": {
      "name": "washing machine"
    }
  }
}

可以看到成功匹配到了数据:

所以将字段设置成keyword,查询的时候已有的值不会被分词。

现在添加一个text类型的字段:

PUT my_index/_mapping/products?update_all_types
{
  "properties": {
      "tag": {
        "type": "text"
      }
  }
}

可以看到添加成功:

往之前已经创建的doc之中添加tag的数据:

POST my_index/products/AWf9f66WV8yLH435XhgI
{
  "name":"washing machine",
  "tag":"electric household"
}

查询一下,可以看到:

然后对tag字段进行查询:

POST  /my_index/products/_search
{
  "query": {
    "term": {
      "tag": "household"
    }
  }
}

可以看到虽然没有全部输入,但是已经查询到了:

现在输入全部的查询:

POST  /my_index/products/_search
{
  "query": {
    "term": {
      "tag": "electric household"
    }
  }
}

 发现现在已经查询不到了:

 

说明text类型的字段会被分词,查询的时候如果用拆开查可以查询的到,但是要是直接全部查,就是查询不到。

注意:“1, 2”会被拆分成[1, 2],但是"1,2"是不拆分的,因为之间少了个空格。

(二)match和term的区别

 

 1.term

 1)term查询keyword字段。

 term不会分词。而keyword字段也不分词。需要完全匹配才可

 

成功。

但是如果:

则查询失败。

 2)term查询text字段。

因为text字段会分词,而term不分词,所以term查询的条件必须是text字段分词后的某一个

 

 

查询成功。

查询失败,因为现在tag已经被分词了,存储的是[he, is, silly, man]。

 这样查询:

也是失败了,道理跟上面的是一样的。

2.match

1)match查询keyword字段

match会被分词,而keyword不会被分词,match的需要跟keyword的完全匹配可以

 

其他的不完全匹配的都是失败的。

2)match查询text字段

match分词,text也分词,只要match的分词结果和text的分词结果有相同的就匹配

成功。如果都不相同就失败了。

3.match_phrase

1)match_phrase匹配keyword字段。

match_phrase会被分词,而keyword不会被分词,match_phrase的需要跟keyword的完全匹配才可以。

只有这种情况才是成功的。

2)match_phrase匹配text字段。

match_phrase是分词的,text也是分词的。match_phrase的分词结果必须在text字段分词中都包含,而且顺序必须相同,而且必须都是连续的

这是成功的。

如果不是连续的,就会失败。

 4.query_string

1)query_string查询key类型的字段,试过了,无法查询。

2)query_string查询text类型的字段。

和match_phrase区别的是,query_string查询text类型字段,不需要连续,顺序还可以调换。

成功。

这样也是可以的。

### ElasticSearch 中 `match_phrase_prefix` 的使用说明 `match_phrase_prefix` 是一种用于短语匹配并支持前缀模糊查询的功能。它能够将输入的查询字符串进行分词处理,并将最后一个分词视为前缀来查找所有可能的匹配项[^3]。 #### 基本语法 以下是 `match_phrase_prefix` 查询的基本结构: ```json { "query": { "match_phrase_prefix": { "<field>": { "query": "<phrase_with_optional_suffix>" } } } } ``` - `<field>` 表示要搜索的目标字段名称。 - `<phrase_with_optional_suffix>` 是希望匹配的短语,其中最后的部分会被当作前缀来进行匹配。 #### 示例解析 假设有一个名为 `kibana_sample_data_ecommerce` 的索引,其数据包含客户姓名 (`customer_full_name`) 字段。如果想找到名字以 "Eddie" 开头的所有记录,则可以运行如下查询: ```json GET kibana_sample_data_ecommerce/_search { "query": { "match_phrase_prefix": { "customer_full_name": { "query": "Eddie" } } } } ``` 上述查询会返回诸如 `"Eddie Underwood"` `"Eddie Utest"` 这样的结果,因为这些条目的名字部分均以 `"Eddie"` 起始。 #### 特性行为特点 1. **短语匹配** 它不仅限于单个词语的前缀匹配,还允许整个短语作为基础条件的一部分参与筛选过程。例如,在文档中寻找类似于 `"quick brown fox jumps over lazy dog"` 的句子片段时非常有用[^1]。 2. **自动分词机制** 输入的查询串会被依据目标字段所关联的分析器规则拆分成多个独立单元 (tokens)[^4]。之后再利用最后一个 token 实现基于前缀的进一步过滤操作。 3. **性能考量** 尽管功能强大,但由于涉及复杂的内部计算逻辑以及潜在的大规模候选集扫描动作,因此相较于其他简单类型的查询而言可能会消耗更多资源时间成本。所以在实际应用过程中需要注意优化设计策略以减少不必要的开销影响整体效率表现[^2]。 #### 多字段联合查询扩展案例 除了单独作用在一个特定属性上之外,还可以通过组合方式实现跨多列的同时检索需求。下面展示了一个例子,演示如何同时针对两个不同维度的数据源实施类似的约束限定: ```json GET my_index/_search { "query": { "bool": { "should": [ { "match_phrase_prefix": { "title": { "query": "learning ma" } } }, { "match_phrase_prefix": { "description": { "query": "introduction to elasti" } } } ] } } } ``` 此脚本旨在找出那些标题里含有像 `"learning machine learning"` 或描述中有类似表述为 `"introduction to elastic search engine architecture"` 等特性的项目实例集合。 ---
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值