我想有一个残酷的对磁盘性能测试。
我们给出了一个系统,可以实现从文档
“1.7 IOPS 使用随机4 k读取比0.3毫秒的延迟。 顺序读取15 GB / s(128 kb / 256 kb),而消费 存储服务器上的CPU利用率30%。 顺序写入是7.5 GB / s。 混合工作负载80/20读/写 (128 kb),基准测试达到10 GB / s”。
我在VM(20芯/ 10 g ram CentOs)和连接到他们的系统通过SCSI电报和原始磁盘。
磁盘ssd,是供应商的建议。 这是他们的白皮书如果需要的话。
这是命令和结果。
命令
fio——文件名= / dev /西班牙直接= 1 - rw = randread - b = 4 k -大小= 2 t - numjobs = 20,运行时= 500——group_reporting name =测试——rwmixread = 100线程——ioengine = libaio iodepth = 32
输出
测试:(g = 0):rw = randread,b =(R)4096 b - 4096 b,b(W)4096 - > 4096 b,4096 b - 4096 b(T),ioengine = libaio iodepth = 32 … fio - 3.1开始20线程^哥伦比亚广播公司(Cbs):20(f = 20): [r(20)][15.4%][r = 30.7 mib / s,w = 0简约/ s][r = 7856 w = 0 IOPS][埃塔07 m:03 s] fio:终止信号2
测试:(groupid = 0,乔布斯= 20):呃= 0:pid = 8926:2018年12月14日02:49:01星期五 读:IOPS = 7875,BW = 30.8 mib / s(32.3 mb / s)(2386 mib / 77575毫秒) 板条(购买):min = 2,max = 635322,avg = 2460.56,方差= 18663.02 clat(购买):min = 474,max = 1094.4 k,avg = 78750.60,方差= 98437.05 纬度(购买):min = 479,max = 1371.9 k,avg = 81211.47,方差= 102373.00 clat百分位数(微秒): | 1.00 =[5],5.00 =[11],10.00 =[14],20.00 =[19], | 30.00 =[24],40.00 =[31],50.00 =[43],62 =[62], | 82 =[82],108 =[108],182 =[182],321 =[321], | 464 =[464],592 =[592],718 =[718],760 =[760], | 99.99 =[944]bw(简约/ s):max = 10048分钟= 7日/ = 5.05%,avg = 1591.57,方差= 1591.72,= 3093 iops样品: min = 1,max = 2512,avg = 397.59,方差= 397.92,= 3093 lat样品 (浓缩):500 = 0.01%,750 = 0.01%,1000 = 0.04%纬度(微秒):2 = 0.33%, 4 = 0.44%,10 = 4.17%,20 = 17.80%,50 lat = 31.70%(微秒):100 = 23.09%, 250 = 15.10%,500 = 6.55%,750 = 0.73%,1000 = 0.05%纬度(微秒): 2000 = 0.01%的cpu:usr = 0.19%,sys = 0.82%,ctx = 50469,majf = 0, minf = 669 IO深度:1 = 0.1%,2 = 0.1%,4 = 0.1%,8 = 0.1%,16 = 0.1%, 32 = 99.9%,> = 64 = 0.0% 提交:0 = 0.0%,4 = 100.0%,8 = 0.0%,16 = 0.0%,32 = 0.0%,64 = 0.0%,> = 64 = 0.0% 完成:0 = 0.0%,4 = 100.0%,8 = 0.0%,16 = 0.0%,32 = 0.1%,64 = 0.0%,> = 64 = 0.0% 发布rwt:总= 610941,0,0 = 0,0,0 = 0,0,0 延迟:目标= 0,窗口= 0,百分位= 100.00%,深度= 32
运行状态组0(所有工作):阅读:bw = 30.8 mib / s(32.3 mb / s), 30.8 mib / s - 30.8 - mib / s(32.3 mb / s - 32.3 mb / s),io = 2386 mib(2502 mb),运行= 77575 - 77575毫秒
我接收的性能非常差在我应该接受的……
我注意到,我可以获得更多的性能改变的块大小但我告诉它应该得到使用4 k块大小。
我的测试充分和准确吗? 我能做更多的工作来获得更好的结果? 为什么我的结果是如此贫穷与供应商相比的结果。