Elasticsearch 数据索引、更新与删除全解析
1. 数据字段类型概述
在 Elasticsearch 中,字段类型主要分为以下三种:
- 核心类型 :包含字符串和数字等。
- 数组和多字段类型 :可在同一字段中存储同一核心类型的多个值,例如 tags 字段可存储多个标签字符串。
- 预定义类型 :如 _ttl(生存时间)和 _timestamp 等。
这些字段类型可视为元数据,Elasticsearch 能自动管理它们以提供额外功能。例如,可配置 Elasticsearch 自动为文档添加新数据(如时间戳),或使用 _ttl 字段在指定时间后自动删除文档。
2. 使用映射定义文档类型
每个文档都属于一个类型,而类型又属于一个索引。可将索引视为数据库,类型视为表。例如,一个聚会网站会为群组和活动使用不同类型,因为这些文档结构不同。若网站还有博客,可将博客文章和评论存储在单独的索引中。
类型包含映射中每个字段的定义,映射包含该类型文档中可能出现的所有字段,并告知 Elasticsearch 如何对文档中的字段进行索引。例如,若字段包含日期,可定义可接受的日期格式。
2.1 类型仅提供逻辑分隔
在 Elasticsearch 中,不同类型的文档没有物理分隔。同一索引内的所有文档,无论类型如何,最终都存储在属于同一分片的同一组文件中。在分片(即 Lucene 索引)中,类型名称是一个字段,所有映射中的字段都作为 Lucene 索引中的字段组合在一起。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



