Elasticsearch集群核心机制

最新推荐文章于 2025-12-03 12:19:20 发布

原创最新推荐文章于 2025-12-03 12:19:20 发布 · 462 阅读

CC 4.0 BY-SA版权

文章标签：

Elasticsearch Cluster（集群） 是由一个或多个节点（Node）组成的分布式系统，共同协作以提供高性能、高可用性和可扩展性的数据存储与搜索能力。它是 Elasticsearch 分布式架构的核心。以下是其核心概念的详细阐述：

节点（Node）
- 一个运行中的 Elasticsearch 实例，通常对应一台物理机或虚拟机。
- 角色分类：
  - Master Node：负责集群管理（创建/删除索引、节点状态维护），不处理用户请求。生产环境需配置多个候选节点（node.roles: [master]）避免脑裂。
  - Data Node：存储数据（分片）、执行搜索和聚合操作（node.roles: [data]）。
  - Ingest Node：数据预处理（如解析、转换），再写入存储（node.roles: [ingest]）。
  - Coordinating Node（默认角色）：路由请求、聚合结果（所有节点均可充当）。
索引（Index）
- 逻辑数据容器（类似数据库中的表），由多个分片（Shard） 组成。
分片（Shard）
- 主分片（Primary Shard）：数据存储与写入的核心单元，数量在索引创建时固定。
- 副本分片（Replica Shard）：主分片的拷贝，提供高可用性（节点故障时接管）和读取扩展性（并行处理查询）。

分布式数据存储
- 数据写入时，通过路由规则（routing）分配到特定主分片。
- 分片均匀分布在所有 Data Node 上（默认路由公式：shard_num = hash(routing) % num_primary_shards）。
高可用性（HA）
- 副本机制：每个主分片有 ≥1 个副本（index.number_of_replicas 配置）。
- 故障恢复：节点宕机时，Master Node 自动将丢失的分片（主/副本）在其他节点上恢复。
横向扩展（Scalability）
- 增加 Data Node → 自动重平衡分片分布，提升存储与计算能力。
- 增加副本数 → 提升查询吞吐量。
集群状态管理
- Master Node 维护全局状态（cluster state），包括节点拓扑、索引元数据、分片位置。
- 状态变更通过低延迟广播同步到所有节点。

通过 GET /_cluster/health 查看状态（关键指标）：