背景
elasticsearch 集群,有时候可能需要修改配置,增加硬盘,扩展内存等操作,需要对节点进行维护升级。
但是记住es是内存数据库,而且同步到磁盘并不是同步的,所以一旦全部重启es,es数据会大量丢失掉,业务也无法正常进行。这是不可忍受的
业务不能停,如果直接kill掉节点,可能导致数据丢失,而且集群会认为该节点挂掉了,就开始转移数据,当重启之后,它又会恢复数据,如果你当前的数据量已经很大了,这是很耗费机器和网络资源的。正常情况下,Elasticsearch 希望你的数据被完全的复制和均衡的分布。
如果你手动关闭了一个节点,集群会立刻发现节点的丢失并开始再平衡。
如果节点的维护是短期工作的话,这一点就很烦人了,因为大型分片的再平衡需要花费相当的时间.一个集群节点重启前要先临时禁用自动分配,设置cluster.routing.allocation.enable为none,否则节点停止后当前节点的分片会自动分配到其他节点上,本节点启动后需要等其他节点RECOVERING后才会RELOCATING,也就是分片在其他节点恢复后又转移回来,浪费大量时间。
# 1. 关闭shard自动均衡
curl -X PUT "localhost:9200/_cluster/settings?pretty" -H 'Content-Type: application/json' -d'
{
"persistent": {
"cluster.routing.allocation.enable": "none"
}
}
'
# 2. 停止非必要的索引并执行同步刷新(可选)
POST /_flush