1、CEPH误删除OSD恢复操作
有时在线上环境由于个人原因会有一些误操作,下面这个例子博主的亲身经历
本来是有一块磁盘损坏,需要将其移除集群,做移除操作,结果在删除key的时候,OSD ID错误,将正常的OSDkey删了。
误执行ceph auth del osd.x
这时候不要慌,只是删除了key,osd的文件目录都存在,只需要在对应节点上将key加回去即可,执行:
ceph auth add osd.x osd 'allow *' mon 'allow rwx' -i /var/lib/ceph/osd/ceph-x/keyring
当完全删除一块好的OSD,怎么将其加回去呢?(前提是文件目录均存在)博主在测试环境做了验证
当将该osd完全删除
将osd从集群移除:ceph osd out 0
将osd从集群删除:ceph osd rm 0
删除osd的crush:ceph osd crush rm osd.0
删除osd验证秘钥:ceph auth del osd.0
在osd 0对应节点上执行如下命令:
more fsid #在osd 0对应目录下执行,会返回uuid值
ceph osd create uuid #会返回osd对应id号,创建osd号
ceph auth add osd.0 osd 'allow *' mon 'allow rwx' -i /var/lib/ceph/osd/ceph-0/keyring #将秘钥添加回去
ceph osd crush add xxx 1.0(权重) host=xxx #将osd添加回集群,xxx为osd号,host为osd对应主机
ceph osd in osd.xxx #将osd在集群in
systemctl start ceph-osd@xx #启动os