ceph pg Troubleshoting

本文详细介绍了在Ceph存储系统中遇到的pg(Placement Group)问题,如stuck在degraded、peering或inactive状态的解决办法。通过`ceph health detail`和`ceph pg dump_stuck_inactive`等命令进行诊断,并提供了针对不同状态的解决策略,如重启osd、标记osd为lost等。此外,还提到了unfound object的情况以及如何处理。最后,讨论了pg inconsistent状态的修复方法,如使用`ceph pg repair`命令。

Troubleshoting pg

stuck placement group

pg 显示 degraded 和 peering 状态很正常,这些信息一般表明对失败的恢复过程采取的正常行动。但是,如果 pg 长时间处于这种状态,表明可能问题很严重。

inactive:pg 太长时间没有 active(pg 无法读写)

unclean:pg 太长时间没有 clean (pg 没有完全从之前的失败中恢复)

stale:ceph-osd 长时间没有报告 pg 的状态,表明存储该 pg 的所有节点可能 down 掉

对于处于 stale 状态的 pg,通常的做法是让对应的 osd 启动。对于 inactive 状态的 pg,通常是一个 peering 问题。对于处于 unclean 状态的 pg ,通常表明有些问题在阻止恢复,比如 object unfound。

placement group down peering failure

有些情况,ceph-osd peering 过程可能出问题,导致 pg 无法 active 和使用。例如下面的问题

[root@k8sGUPMaster01 ~]# ceph health detail
HEALTH_WARN Reduced data availability: 1 pg inactive, 1 pg peering
PG_AVAILABILITY Reduced data availability: 1 pg inactive, 1 pg peering
    pg 8.15 is stuck peering for 609046.271579, current state peering, last acting [44,29,38]

使用 ceph pg query 查

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值