[Elasticsearch] 向已存在的索引中添加自定义filter/analyzer

最新推荐文章于 2024-06-17 00:13:22 发布

转载最新推荐文章于 2024-06-17 00:13:22 发布 · 1.3k 阅读

文章标签：

#elasticsearch #索引

ElasticSearch 专栏收录该内容

13 篇文章

订阅专栏

本文介绍如何在已存在的Elasticsearch索引中添加自定义的Analyzer和Filter，包括遇到的问题及两种解决方案：重建索引和使用_open与_close端点进行更新。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

问题描述

随着应用的不断升级，索引中的类型也会越来越多，新增加的类型中势必会使用到一些自定义的Analyzer。但是通过_settings端点的更新API不能直接在已经存在的索引上使用。在sense中进行更新时会抛出异常：

PUT /symbol
{
  "settings": {
    "analysis": {
      "filter": {
        "edgengram": {
           "type": "edgeNGram",
           "min_gram": "1",
           "max_gram": "255"
        }
      },
      "analyzer": {
        "symbol_analyzer": {
          "type": "custom",
          "char_filter": [],
          "tokenizer": "standard",
          "filter": [
            "lowercase",
            "word_delimiter"
          ]
        },
        "back_edge_ngram_analyzer": {
          "type": "custom",
          "char_filter": [],
          "tokenizer": "whitespace",
          "filter": [
            "reverse",
            "edgengram",
            "reverse"
          ]
        }
      }
    }
  }
}1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35

上例中，我们希望向名为symbol的索引中添加一个filter和两个analyzers。但是会抛出如下的错误信息：

{
   "error": "IndexAlreadyExistsException[[symbol] already exists]",
   "status": 400
}1
2
3
4
1
2
3
4

提示我们该索引已经存在了，无法添加。

解决方案

最直观的解决方案是首先备份该索引中已经存在的数据，然后删除它再重建该索引。这种方式比较暴力，当索引中已经存在相当多的数据时，不建议这样做。

另外一种方案是使用_open和_close这一对端点，首先将目标索引关闭，执行需要的更新操作，然后再打开该索引。

POST /symbol/_close

PUT /symbol/_settings
{
  "settings": {
    ....    
  }
}

POST /symbol/_open1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10

这样就避免了需要重建索引的麻烦。有了新添加的filter和analyzer，就可以根据需要再对types中的mappings进行更新了。