## 显示集群所有的异常状态信息
ceph health detail
## 指定PG ID进行3个副本的数据校验
ceph pg scrub <pgid>
## 指定PG ID进行repair
ceph pg repair <pgid>
## inactive无法处理读或写,正在等待其他osd的最新副本
## unclean 未达到指定副本,应该被恢复
## stale 当前pg卡住,因为osd primary未在规定时间上报状态给mon
ceph pg dump_stuck {inactive|unclean|stale} {<int>} (ok表示无异常)
## 查看集群osd的结构,可以和lsblk结果对比。
ceph osd tree/dump
## 定位osd在哪台主机
ceph osd find <osd.id>
## 修改osd权重,weight范围为0.0-1.0.一般用于缩容。
ceph osd reweight <osd.id> <weight>
## 调整pool参数,常用于调整副本数、pg数。pg数见一位2的n次方,向大调整
ceph osd pool set {pool-name} {key} {value}
## 调整集群状态,一般在调整集群时设置
ceph osd set/unset nodown/noout/nobackfill
## 批量开启
cat rgw.txt | xargs -i -P 20 systemctl start/status/stop {}
常用ceph集群故障检查命令
于 2023-01-28 13:10:07 首次发布