ceph集群如果出现坏盘,在更换磁盘的过程中,pg可能会出现unfound的状态,pg unfound状态处理方法:
1)尝试让失败的osd起来,如果起来后集群恢复正常,则结束
2)尝试将改PG的unfound对象回滚到上一个版本,ceph pg $pgid mark_unfound_lost revert,如果恢复,则正常
3)如果还是不行,那只有将该object删除掉,注意这会导致丢失数据,ceph pg $pgid mark_unfound_lost delete
4)如果以上方法都不行,停止集群全部OSD,删除pg,启动全部OSD,让后重新创建对应的pg