一次CephFS性能分析

CephFS性能瓶颈诊断:从理论到实践

一次CephFS性能分析

1. 背景

小明在使用文件系统的过程中发现上传一个文件夹花了半个小时,下载一个文件夹要花更长的时间,不可思议,确实下载速度应该远远大于上传速度的,我们来分析下问题出在哪

文件的情况:

  • 文件大小: 6.3G
  • 文件个数: 252494
  • 小明使用文件系统作为容器的持久化存储

2. 性能分析思路

2.1. 理论值计算

一切分析从数据出发,首先看下正常应该是怎么样的

hdd 下一般磁盘 4k 随机写 iops为1000左右

  • 测算依据
    • 文件个数
    • 文件大小
    • 4k的iops 1000左右
  • 测算过程
    • 6.3G / 252494 平均每个文件大小 26k
    • 对应的26k的iops 26/4=6.5 1000/6.5 = 153

也就是说理论上传时间需要28分钟 252494 / 153 / 60 = 28

2.2. 实际操作下看能不能复现

将文件系统挂载到跟有问题的环境网络环境差不多的虚拟机上

拷贝文件

2.2.1. 性能分析关注点

一切性能问题,要么是CPU计算不过来了,要么是内存满了(使用swap),要么是磁盘慢、网络繁忙

加粗的指标重点关注

  • CPU、内存
    文件系统的话服务端是MDS,传输过程中查看MDS的内存占用和CPU占用
  • 磁盘压力
    • ceph层面的io性能指标
      • ceph -s输出中的 client.io
      • ceph osd perf|sort -rnk 20 有没时延特别高的上百的
    • 本地磁盘的io性能
      • iostat
        • r/s 读ops
        • w/s 写ops
        • rMB/s 读带宽
        • wMB/s 写带宽
        • await 时延
        • %util 利用率

2.2.2. 开始分析

上传文件的过程中分析

2.2.2.1. ceph -s
    client:   0 B/s rd, 3.5 MiB/s wr, 72 op/s rd, 461 op/s wr

关注这行,正常的hdd集群有压力的时候前两个数值其中一个在100以上,后面两个数值至少在1000以上,在上传过程都没超过,说明集群本身没问题

2.2.2.2. 查看mds服务

ceph fs status 可以看到哪个是主mds,请求只到主mds上

cephfs - 11 clients
======
+------+--------+--------+---------------+-------+-------+
| Rank | State  |  MDS   |    Activity   |  dns  |  inos |
+------+--------+--------+---------------+-------+-----
### 不同分布式文件系统的特性和差异 #### JuiceFS 特性 JuiceFS 是一种高性能的分布式文件系统,专为云环境设计。其主要特点包括支持多种存储后端、高可用性和弹性扩展能力。通过集成对象存储服务作为底层数据持久化层,JuiceFS 提供了良好的性能和成本效益平衡。 - 支持 POSIX 文件接口访问方式。 - 可配置元数据引擎来优化读写操作效率[^1]。 #### CubeFS 特性 CubeFS 同样是一个分布式的文件系统解决方案,专注于大规模数据分析场景下的高效处理需求。它具备如下优势: - 高效的数据压缩机制有助于减少磁盘占用并提升传输速度。 - 自动化的分片管理简化运维工作量的同时提高了集群稳定性。 - 内置冗余保护措施保障数据安全可靠[^2]。 #### CephFS 特性 CephFS 构建于 Ceph 存储平台之上,提供了一个兼容POSIX标准的文件系统界面给应用程序使用。该方案具有以下亮点: - 完整实现了 POSIX 协议栈使得传统应用无需修改即可无缝迁移至云端部署模式下运行。 - 动态调整副本数量以适应不同业务负载变化情况下的SLA要求。 - 强大的社区支持以及丰富的插件生态体系方便二次开发定制功能模块[^3]。 #### 性能对比分析 从查询性能角度来看,在某些特定条件下 Pinot 的排序特性可能优于 Druid ,这可能是由于前者提供了开箱即用的支持而后者则需手动实现复杂逻辑所致;然而这种差异并不适用于上述三种文件系统之间直接比较因为它们各自面向的应用领域有所区别[^4]。 对于空间消耗而言,Pinot 中有效的数据排列可以带来更佳的压缩效果从而节省更多资源——这一点同样不是衡量这三个目标时的关键考量因素之一[^5]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值