Elasticsearch权威指南：滚动重启集群的正确姿势-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00488/article/details/148577146

Elasticsearch权威指南：滚动重启集群的正确姿势

滚动重启（Rolling Restart）是Elasticsearch集群维护中的一项重要技术，它允许我们在保持集群在线和可操作的情况下，逐个节点进行重启操作。这种技术通常用于以下场景：

Elasticsearch天生具备数据复制和自动平衡的特性。当某个节点下线时，集群会立即检测到节点缺失并开始重新平衡数据分片。对于短期维护来说，这种自动行为反而会造成不必要的开销：

建议操作（非强制但强烈推荐）：

POST /_flush/synced

技术说明：同步刷新是"尽力而为"的操作，如果有未完成的索引操作会失败，但可以安全地多次重试。

这是关键步骤，防止Elasticsearch在节点下线时自动重新平衡数据：

PUT /_cluster/settings
{
    "transient" : {
        "cluster.routing.allocation.enable" : "none"
    }
}

节点重新加入后，重新启用分片分配：

PUT /_cluster/settings
{
    "transient" : {
        "cluster.routing.allocation.enable" : "all"
    }
}

重要：等待集群状态恢复为"green"后再继续下一个节点。

重复上述步骤2-6，直到所有节点完成维护。

虽然此时可以恢复数据索引，但建议等待集群完全平衡后再恢复写入，这样可以加快平衡过程。

通过遵循这些步骤和建议，可以确保Elasticsearch集群在维护期间保持稳定，同时最小化对业务的影响。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考