故障现场:
ceph 客户端所有命令阻塞,无响应。
看到此问题,第一时间想到的是mon这个进程问题, 查看本机进程, mon 程序正常。
查看 集群的mon 信息。
sudo ceph --cluster=ceph --admin-daemon /var/run/ceph/ceph-mon.node1.asok mon_status
展示了集群的所有mon
登陆其他机器查看, 发现 其他 mon 没有起来, 3个mon 只有一个, 拉起其他两个即可正常。
mon 添加,
ceph.conf 文件 修改
mon_initial_members = node1, node2, node3
mon_host = 172.16.0.127, 172.16.0.110, 172.16.0.61
public_network = 172.16.0.0/20
推送配置文件
ceph-deploy --overwrite-conf config push node{1..3}
ceph-deploy mon create node2
ceph-deploy mon create node3
ceph --cluster=ceph --admin-daemon /var/run/ceph/ceph-mon.node1.asok mon_status
Ceph集群增