Ceph Monitor挂了之后对集群的影响

当Ceph集群的Monitor挂掉一个时,不影响I/O操作,但会影响命令执行,可通过调整配置解决。若挂掉两个Monitor,所有ceph命令无法执行,现有I/O在Cluster map不变时可继续,但新请求会被阻塞。恢复Monitor后,集群可恢复正常。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目前,Ceph作为统一存储的解决方案,已经得到了许多互联网公司的广泛应用,而大家搭建的Ceph环境也大多参照了国内最早研究Ceph的OpenStack公司UnitedStack(有云)分享出来的方案:即数据3副本、3个monitor做高可用等。

Monitor相当于是Ceph集群的大脑,使用了3个做高可用防止单点故障的发生。经常有同事或者客户会问到一个问题:就是monitor最多能挂几个,集群就不能工作了?

答案是只能挂一个,原因是Monitor采用了Paxos的选举机制来实现多个之间的协调同步,而这中选举机制要求必须要有半数以上的成员存活的时候,整体才能对外提供服务。到底是这样吗?我通过以下测试得到了最终结论。

测试环境:
一个18个osd、3个mon的集群

测试目的:
1)确认挂掉一个mon对集群的影响
2)确认挂两个/三个mon之后,集群能否工作,进行读写
3)确认当mon恢复之后,集群能够恢复正常

测试过程:
1 确认挂一个mon对集群的影响
1)确认对IO的影响
在其中一台机器上通过$ fio -ioengine=rbd -rw=randwrite -name=ebs -thread -pool=metadata -direct=1 -bs=4k -rbdname=test1 -iodepth=64 -runtime=600 --time_based进行压力测试,然后将其中一个mon down 掉观察对IO的影响。

2)观察对命令执行的影响
down掉一个mon之后,执行命令会碰到如下连接失败的log:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值