ES分布式机制的透明性，垂直扩容和水平扩容，数据rebalance,master节点,节点平等的分布式架构,shard和replica机制(学习)

最新推荐文章于 2025-05-24 16:50:26 发布

原创最新推荐文章于 2025-05-24 16:50:26 发布 · 3.4k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#elasticsearch

Elasticseach/Logstash/Kibana 专栏收录该内容

24 篇文章

订阅专栏

本文介绍了Elasticsearch的分布式特性，包括隐藏的复杂分布式机制、支持的垂直和水平扩容方式、数据rebalance机制、节点平等架构、shard与replica机制，以及创建index的过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、Elasticsearch对复杂分布式机制的透明影藏特性

Elasticsearch是一套分布式的系统，分布式是为了应对大数据量影藏了复杂的分布式机制。

分片机制（我们可以随随便便就将一些document插入到es集群中去，我们没有care过数据是怎么进行分片的，数据到哪个shard中去）

cluster discovery(集群发现机制，集群status从yellow转green的实现里，直接启动了第二个es进程，那个进程作为一个node自动就发现了集群，并且加入了进去，还接受了部分数据，replica shard)

shard负载均衡（举例，假设现在有3个节点，总共有25个shard要分配到3个节点上去，es会自动进行均匀分配，以保持每个节点的均衡的读写负载请求）

shard副本，请求路由，集群扩容，shard重分配。

2、Elasticsearch支持垂直扩容和水平扩容

垂直扩容：采购更强大的服务器。
水平扩容：采购越来越多的普通服务器，性能比较一般，但是很多普通服务器组织在一起，就能构成强大的计算和存储能力。

扩容对应用程序的透明性。

3、增加或减少节点时的数据rebalance

保持负载均衡

4、master节点

(1)、创建或删除索引
(2)、增加或删除节点

5、节点平等的分布式架构

(1)、节点对等，每个节点都能接收所有的请求。
(2)、自动请求路由
(3)、响应收集

6、shard和replica机制再次梳理

（1）index包含多个shard
（2）每个shard都是一个最小工作单元，承载部分数据，lucene实例，完整的建立索引和处理请求的能力
（3）增减节点时，shard会自动在nodes中负载均衡
（4）primary shard和replica shard，每个document肯定只存在于某一个primary shard以及其对应的replica shard中，不可能存在于多个primary shard
（5）replica shard是primary shard的副本，负责容错，以及承担读请求负载
（6）primary shard的数量在创建索引的时候就固定了，replica shard的数量可以随时修改
（7）primary shard的默认数量是5，replica默认是1，默认有10个shard，5个primary shard，5个replica shard
（8）primary shard不能和自己的replica shard放在同一个节点上（否则节点宕机，primary shard和副本都丢失，起不到容错的作用），但是可以和其他primary shard的replica shard放在同一个节点上

7、创建index是什么样子的

(1)单node环境下，创建一个index，有3个primary shard,3个replica shard

PUT /test_index
{
  "settings": {
  "number_of_shards": 3,
  "number_of_replicas": 1
  }
}

这里写图片描述

这里写图片描述
(2)、集群status是yellow
(3)、这个时候，只会将3个primary shard分配到仅有的一个node上去，另外3个replica shard是无法分配的。
(4)、集群可以正常工作，但是一旦出现节点宕机，数据全部丢失，而且集群不可用，无法承接任何请求。