今天没别的意思,就是想折腾下ETCD集群如果出现故障后会咋样,随便玩玩。
0.环境是,三台独立的ubuntu机器,搭建的一个三节点的etcd集群。

1.先看下正常状态下的一组操作。

2.直接干掉一个节点,但是不是主节点。
此时在活着的两台机器上执行 etcdctl member list 都是这个结果

然后三台分别执行etcdctl endpoint health,活着的两台是health,死的是unhealth。
本文通过在三节点的ETCD集群上模拟节点故障,观察并分析其行为。首先,在正常状态下进行基本操作。然后,依次关闭非主节点,发现集群仍能保持部分功能。接着,重启关闭的节点,数据能够同步。但当关闭两个节点时,集群无法正常工作。最后,了解`etcdctl member list`并不显示在线节点。整个过程中,集群会持续尝试恢复所有节点的连接。
今天没别的意思,就是想折腾下ETCD集群如果出现故障后会咋样,随便玩玩。
0.环境是,三台独立的ubuntu机器,搭建的一个三节点的etcd集群。

1.先看下正常状态下的一组操作。

2.直接干掉一个节点,但是不是主节点。
此时在活着的两台机器上执行 etcdctl member list 都是这个结果

然后三台分别执行etcdctl endpoint health,活着的两台是health,死的是unhealth。
1088
854
1694
4602
976