问题概述:
ceph -s 显示pg 10.17 inconsistent
且命令ceph pg repair 10.17无法修复,/var/log/ceph/cep-osd.3.log报错内容如下:
pg 10.17 osd [3,4] 权威副本osd:3
repair 10.17 10:e889b16a:::rbd_data.88033092ad95.0000000000000012:b : is an unexpected clone
修复步骤:
0.备份
rados -p ceph-kvm-pool get rbd_data.88033092ad95.0000000000000012 /tmp/rbd_data.88033092ad95.0000000000000012
1.禁止集群均衡
ceph osd set noout
ceph osd set noscrub
ceph osd set nodeep-scrub
2.禁止recover
ceph osd set nobackfill
ceph osd set norebalance
ceph osd set norecover
3.停止osd
systemctl stop ceph-osd@3
4.列出快照
ceph-objectstore-tool --pgid 10.17 \
--data-path /var/lib/ceph/osd/ceph-3/ \
--op list | grep rbd_data.88033092ad95.0000000000000012
5.删除有问题的快照
日志里:rbd_data.88033092ad95.0000000000000012:b : is an unexpected clone
b转为十进制为11,因此需要删除的为snapid为11的快照
ceph-objectstore-tool --pgid 10.

文章讲述了在Ceph集群中遇到pg10.17状态不一致的问题,详细描述了如何通过备份、禁用功能、删除快照、重启osd等步骤来解决,并在处理完毕后进行深度扫描。
最低0.47元/天 解锁文章
1120

被折叠的 条评论
为什么被折叠?



