Elasticsearch 索引分片与容量规划全解析
在使用 Elasticsearch 时,索引分片的数量是将文档路由到分片的算法中的一个重要元素,其路由公式为:
shard = hash(routing) % number_of_primary_shards
当索引的分片数量不足时,我们唯一的选择是将数据重新索引到一个更大、分片更多的新索引中,但这会耗费大量时间。其实,我们可以通过预先规划,进行分片超额分配来避免这个问题。
分片超额分配
一个分片只能存在于一个节点上,但一个节点可以容纳多个分片。假设我们创建一个索引时使用两个主分片而不是一个:
PUT /my_index
{
"settings": {
"number_of_shards": 2,
"number_of_replicas": 0
}
}
上述代码创建了一个包含两个主分片且无副本分片的索引。在只有一个节点的情况下,两个分片都会被分配到该节点。从应用程序的角度来看,一切功能与之前相同,因为应用程序是与索引进行通信,而不是与分片通信,并且仍然只有一个索引。
当我们添加第二个节点时,Elasticsearch 会自动将一个分片从第一个节点移动到第二个节点。迁移完成后,每个分片将获得之前两倍的计算能力。通过这种方式,我们只需将一个分片通过网络复制到新节点,就能够将容量翻倍,而且整个过程无需停机,所有索引和搜索请求在分片移动期间都能正常运行。
超级会员免费看
订阅专栏 解锁全文
962

被折叠的 条评论
为什么被折叠?



