ES 字段的映射定义了字段的类型及其行为

原创于 2025-03-25 13:50:20 发布 · 599 阅读

CC 4.0 BY-SA版权

文章标签：

在 Elasticsearch 中，字段的映射定义了字段的类型及其行为。你提供的 content_answer 字段映射如下：

Json
深色版本
"content_answer": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
}
这个映射的含义可以分解为以下几个部分进行解释：

1. 主字段：content_answer
"type": "text"：
表示 content_answer 是一个全文搜索字段。
text 类型的字段会被分词器（Analyzer）处理，分割成多个词条（tokens），用于全文搜索。
例如，如果字段值是 "这是测试文本"，分词器可能会将其分割为 ["这是", "测试", "文本"]。
默认情况下，text 类型字段使用标准分词器（Standard Analyzer）。如果未指定分词器，Elasticsearch 会根据字段内容的语言自动选择合适的分词器。
2. 子字段：content_answer.keyword
"fields"：
定义了一个或多个人字段（sub-fields），这些子字段共享主字段的数据，但具有不同的行为或用途。
在这里，content_answer 定义了一个名为 keyword 的子字段。
"type": "keyword"：
表示 content_answer.keyword 是一个精确匹配字段。
keyword 类型的字段不会被分词器处理，而是将整个字段值作为一个整体存储。
适用于精确匹配、排序和聚合操作。
"ignore_above": 256：
表示如果字段值的长度超过 256 个字符，则该字段值将被忽略，不会被索引。
这是为了避免对过长的字段值进行索引，从而节省存储空间并提高性能。
注意：这里的长度是指字符数（UTF-8 编码下的字符数），而不是字节数。
3. 使用场景
(1) 全文搜索
主字段 content_answer 用于全文搜索。
例如，查询关键字 "测试" 可以匹配到字段值 "这是测试文本"，因为分词器会将 "这是测试文本" 分割为 ["这是", "测试", "文本"]。
(2) 精确匹配
子字段 content_answer.keyword 用于精确匹配。
例如，查询字段值 "这是测试文本" 只能匹配到完全相同的字段值，而不能匹配到部分匹配的内容。
(3) 排序和聚合
keyword 类型的字段支持排序和聚合操作。
例如，可以按 content_answer.keyword 对文档进行排序，或者对 content_answer.keyword 的值进行计数统计。
4. 示例
假设索引中有一条文档：

Json
深色版本
{
"content_answer": "这是测试文本"
}
(1) 查询全文搜索字段
执行以下查询时，content_answer 会参与全文搜索：

Json
深色版本
POST your_index_name/_search
{
"query": {
"match": {
"content_answer": "测试"
}
}
}
查询逻辑：分词器会将 "测试" 分割为单个词条，并与 content_answer 的分词结果进行匹配。
(2) 查询精确匹配字段
执行以下查询时，content_answer.keyword 会参与精确匹配：

Json
深色版本
POST your_index_name/_search
{
"query": {
"term": {
"content_answer.keyword": "这是测试文本"
}
}
}
查询逻辑：只有字段值完全等于 "这是测试文本" 的文档才会被匹配。
(3) 聚合操作
执行以下聚合操作时，content_answer.keyword 会参与聚合：

Json
深色版本
POST your_index_name/_search
{
"size": 0,
"aggs": {
"content_stats": {
"terms": {
"field": "content_answer.keyword"
}
}
}
}
聚合逻辑：统计 content_answer.keyword 的不同值出现的次数。
5. 总结
主字段 content_answer：
类型为 text，用于全文搜索。
值会被分词器处理，适合模糊匹配。
子字段 content_answer.keyword：
类型为 keyword，用于精确匹配、排序和聚合。
值不会被分词器处理，适合精确匹配和结构化操作。
通过这种多字段映射设计，Elasticsearch 提供了灵活性，允许同一个字段同时支持全文搜索和精确匹配等不同场景。