遇到的一些CEPH故障处理

本文详述了几个常见的CEPH故障处理方法,包括误删除OSD的恢复、journal分区损坏后的重建、设备宕机后OSD的挂载问题以及如何处理scrub errors。通过具体步骤和命令指导,帮助解决CEPH集群中遇到的实际问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、CEPH误删除OSD恢复操作

有时在线上环境由于个人原因会有一些误操作,下面这个例子博主的亲身经历

 

本来是有一块磁盘损坏,需要将其移除集群,做移除操作,结果在删除key的时候,OSD ID错误,将正常的OSDkey删了。

误执行ceph auth del osd.x

这时候不要慌,只是删除了key,osd的文件目录都存在,只需要在对应节点上将key加回去即可,执行:

ceph auth add osd.x osd 'allow *' mon 'allow rwx' -i /var/lib/ceph/osd/ceph-x/keyring

 

当完全删除一块好的OSD,怎么将其加回去呢?(前提是文件目录均存在)博主在测试环境做了验证

当将该osd完全删除

将osd从集群移除:ceph osd out 0

将osd从集群删除:ceph osd rm 0

删除osd的crush:ceph osd crush rm osd.0

删除osd验证秘钥:ceph auth del osd.0

 

在osd 0对应节点上执行如下命令:

more fsid #在osd 0对应目录下执行,会返回uuid值

ceph osd create uuid #会返回osd对应id号,创建osd号

ceph auth add osd.0 osd 'allow *' mon 'allow rwx' -i /var/lib/ceph/osd/ceph-0/keyring #将秘钥添加回去

ceph osd crush add xxx 1.0(权重) host=xxx #将osd添加回集群,xxx为osd号,host为osd对应主机

ceph osd in osd.xxx #将osd在集群in

systemctl start ceph-osd@xx #启动os

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值