Elasticsearch 数据映射:动态与显式映射的深度解析
1. Elasticsearch 基础概述
Elasticsearch 是一款强大的搜索和分析引擎,能处理多种数据源的数据索引。以下是其基础特性:
- 数据索引 :需将数据导入进行索引,数据源多样,如文件、数据库、实时流、推特等。
- 索引过程 :数据会经历严格分析阶段,创建倒排索引等高级数据结构。
- 数据检索 :通过搜索 API 检索数据,单文档检索还可用文档 API。
- 数据格式 :传入数据需封装为 JSON 文档,JSON 文档是基本数据存储实体,会持久化到分片和副本。
- 分片和副本 :是 Apache Lucene 实例,负责持久化、检索和分发文档。
- 集群启动 :启动时为单节点单集群应用,添加节点可扩展为多节点集群。
- 数据结构 :为快速检索和持久化,针对文本等结构化数据创建倒排索引,针对日期、数字等非结构化数据创建 BKD 树。
- 相关性评分 :检索结果有正浮点相关性评分,定义文档与搜索条件的匹配程度。
- 算法使用 :采用 Okapi Best Match (BM) 25 相关性或相似度算法,是词频/逆文档频率相似度算法的增强版。
- 扩展方式 :可按需和资源
超级会员免费看
订阅专栏 解锁全文
501

被折叠的 条评论
为什么被折叠?



