Ceph监控与调优全解析
1. Ceph状态解读
1.1 不完整状态(Incomplete state)
不完整状态意味着Ceph无法在当前集群中所有正常运行的OSD上的PG内找到对象的任何有效副本。这可能是对象根本不存在,或者现有对象缺少在当前不可用的OSD上可能发生的新写入。
1.2 下线状态(Down state)
此状态通常伴随不完整状态出现。PG缺少已知可能位于不可用OSD上的对象,并且PG无法启动。
1.3 回填和恢复空间不足状态(Backfill_toofull and recovery_toofull state)
Ceph尝试恢复数据,但OSD磁盘已满,无法继续。需要额外的OSD来解决此问题。
2. 使用collectd监控Ceph
为了深入了解Ceph集群及其相关基础设施的运行情况,需要更详细的监控设置。我们将使用collectd捕获Ceph性能指标,将其存储在Graphite中,并使用Grafana创建带有图表的仪表板。
2.1 Graphite安装与配置
Graphite是一个时间序列数据库,擅长存储大量指标,并具有成熟的查询语言。
- 安装Graphite相关包:
sudo apt-get install graphite-api graphite-carbon graphite-web
- 编辑
/etc/graphite/storage-sche
超级会员免费看
订阅专栏 解锁全文
131

被折叠的 条评论
为什么被折叠?



