Elasticsearch入门

最新推荐文章于 2025-07-02 10:57:05 发布

原创最新推荐文章于 2025-07-02 10:57:05 发布 · 236 阅读

0 ·

CC 4.0 BY-SA版权

大数据专栏收录该内容

1 篇文章

订阅专栏

本文介绍Elasticsearch的高级功能，包括全文搜索、相关性评分、TF/IDF算法及聚合操作，通过具体案例演示如何高效地进行数据检索与分析。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

https://es.xiaoleilu.com/010_Intro/25_Tutorial_Indexing.html
数据库类似的功能。类似于json的格式，加上表结构和类型结构的定义。

Elasticsearch集群可以包含多个索引(indices)（数据库），每一个索引可以包含多个类型(types)（表），每一个类型包含多个文档(documents)（行），然后每个文档包含多个字段(Fields)（列）。

全文搜索

搜索所有喜欢“rock climbing”的员工：

GET /megacorp/employee/_search
{
    "query" : {
        "match" : {
            "about" : "rock climbing"
        }
    }
}

你可以看到我们使用了之前的match查询，从about字段中搜索"rock climbing"，我们得到了两个匹配文档：

{
   ...
   "hits": {
      "total":      2,
      "max_score":  0.16273327,
      "hits": [
         {
            ...
            "_score":         0.16273327, <1>
            "_source": {
               "first_name":  "John",
               "last_name":   "Smith",
               "age":         25,
               "about":       "I love to go rock climbing",
               "interests": [ "sports", "music" ]
            }
         },
         {
            ...
            "_score":         0.016878016, <2>
            "_source": {
               "first_name":  "Jane",
               "last_name":   "Smith",
               "age":         32,
               "about":       "I like to collect rock albums",
               "interests": [ "music" ]
            }
         }
      ]
   }
}

（传统数据库很难实现的一种的操作）会有相关性评分。给出按相关性排名的结果。
相关性(relevance)的概念在Elasticsearch中非常重要，而这个概念在传统关系型数据库中是不可想象的，因为传统数据库对记录的查询只有匹配或者不匹配。
相似度、相关性计算：算法被定义为 TF/IDF，即检索词频率/反向文档频率。

聚合（类似于group by）

https://es.xiaoleilu.com/010_Intro/35_Tutorial_Aggregations.html
先看一下聚合结果：
各种兴趣爱好下的平均年龄统计：

 "all_interests": {
     "buckets": [
        {
           "key": "music",
           "doc_count": 2,
           "avg_age": {
              "value": 28.5
           }
        },
        {
           "key": "forestry",
           "doc_count": 1,
           "avg_age": {
              "value": 35
           }
        },
        {
           "key": "sports",
           "doc_count": 1,
           "avg_age": {
              "value": 25
           }
        }
     ]
  }