ElasticSearch的基本概念

最新推荐文章于 2025-03-27 18:22:51 发布

原创最新推荐文章于 2025-03-27 18:22:51 发布 · 455 阅读

0 ·

CC 4.0 BY-SA版权

技术博客专栏收录该内容

15 篇文章

订阅专栏

本文介绍了Elasticsearch中的核心概念，包括集群、节点、索引、类型、文档、分片和副本等，并详细解释了它们的作用及相互之间的关系。

                    
                        
                    
                    概念解释
Cluster集群，一个集群中包含多个node.
Node一个elasticsearch服务器。
Index索引，包含一堆有相似结构的文档数据，类似于关系型数据库的一个库。一个index下可以有多个type.
Type类型，每个索引里都可以有一个或多个type，type是index中的一个逻辑数据分类，类似于关系型数据库的一张表。一个type下可以有多个document.
Document文档，一个document包含读个field(字段)，类似于关系型数据库的一行记录。
shard单台机器无法存储大量数据，es可以将一个索引中的数据切分为多个shard，分布在多台服务器上存储。有了shard就可以横向扩展，存储更多数据，让搜索和分析等操作分布到多台服务器上去执行，提升吞吐量和性能。每个shard都是一个lucene index。
replica任何一个服务器随时可能故障或宕机，此时shard可能就会丢失，因此可以为每个shard创建多个replica副本。replica可以在shard故障时提供备用服务，保证数据不丢失，多个replica还可以提升搜索操作的吞吐量和性能。primary shard（建立索引时一次设置，不能修改，默认5个），replica shard（可以修改数量，默认1个），默认每个索引10个shard，5个primary shard，5个replica shard，最小的高可用配置，是2台服务器。

                

概念	解释
Cluster	集群，一个集群中包含多个node.
Node	一个elasticsearch服务器。
Index	索引，包含一堆有相似结构的文档数据，类似于关系型数据库的一个库。一个index下可以有多个type.
Type	类型，每个索引里都可以有一个或多个type，type是index中的一个逻辑数据分类，类似于关系型数据库的一张表。一个type下可以有多个document.
Document	文档，一个document包含读个field(字段)，类似于关系型数据库的一行记录。
shard	单台机器无法存储大量数据，es可以将一个索引中的数据切分为多个shard，分布在多台服务器上存储。有了shard就可以横向扩展，存储更多数据，让搜索和分析等操作分布到多台服务器上去执行，提升吞吐量和性能。每个shard都是一个lucene index。
replica	任何一个服务器随时可能故障或宕机，此时shard可能就会丢失，因此可以为每个shard创建多个replica副本。replica可以在shard故障时提供备用服务，保证数据不丢失，多个replica还可以提升搜索操作的吞吐量和性能。primary shard（建立索引时一次设置，不能修改，默认5个），replica shard（可以修改数量，默认1个），默认每个索引10个shard，5个primary shard，5个replica shard，最小的高可用配置，是2台服务器。