为什么延迟是存储中最重要的指标

最新推荐文章于 2025-06-16 09:54:06 发布

原创最新推荐文章于 2025-06-16 09:54:06 发布 · 1.9k 阅读

CC 4.0 BY-SA版权

本文探讨了计算机行业中衡量性能的不同指标，重点介绍了“延迟”这一关键任务指标的重要性。文章通过对比带宽、IOPS等概念，阐述了在事务处理过程中，降低延迟不仅能提升用户体验，还能显著提高整体系统的成本效益。

在计算机行业中，我们通过多种方式来衡量性能。例如，在数字存储空间中，专家使用诸如每秒输入/输出操作（IOPS）或吞吐量（带宽）之类的测量。所有这些术语都与正确的设置相关，但是这里想要强调最关键的任务指标是“延迟”。举例说明，开车上下班经过的行车公路，就具有一定的特性。比如行车公路上有多个车道，类似于带宽，并且每小时的车辆总数具有一定的容量，这类似于IOPS。问题是，即使你知道这两个值，你也无法回答最重要的问题：上班需要多长时间？大多数应用程序创建并使用少量数据。例如，当用户进行信用卡交易时需要进行一些操作，该程序必须验证消费者的身份，执行安全检查，验证交易并记录相应帐户上的借方和贷方条目。虽然您确实需要足够的带宽和容量来处理事务，但最关键的指标是延迟，即完成事务所需的时间。

“价值指标”的核心是事务延迟，对于延迟，自然是越快越好。就像上述提到的举例，如果在没有车辆的行车公路上行驶，增加车道数不会减少上班消耗的时间；同样的，如果公路不拥挤，增加公路可以处理的汽车数量，对性能并没有任何影响。关于存储，我们面临着一个独特的挑战。性能的主要因素是读取或写入数据的速度，当磁盘驱动器是主要存储介质时，时间是以毫秒为单位进行测量。

随着flash memory（闪存）的发展，延迟已进入到微秒级范畴，这为计算环境提供了很大的价值，重点注意的是，单个flash存储系统的实际性能可能相差10倍！因此，当评估存储系统的性能时，要理解的关键指标是“最大延迟保证”。尽管闪存阵列对应用程序的实际性能和总成本有重大影响，但很少有闪存阵列能够保持持续的低延迟。

经常会发现供应商指定了他们系统的平均延迟。根据多年使用存储平台的经验，特定事务的实际延迟值可能与给定的平均值相差很大。再次回到之前提到的举例，要求到达公司的时间为早上9点，如果只是知道从出发地点到公司的平均时间并不会有多大帮助，需要知道的是最坏情况下花费的时间，只有知道这个数值才能确保准时到达公司。评估几乎所有基于事务的计算工作负载的总体性能时，存储延迟是最关键的因素。除了在事务处理较快时为用户提供更多价值之外，降低延迟对整个系统的成本也有重大影响。当数据库读取数据时，其他什么也做不了，通常只能等待它获得所需数据，这种等待就像是汽车在红灯时发动机还在不停的运转着，哪里也去不了但汽车仍在消耗资源。更低的延迟意味着减少等待时间，并使一组给定的计算资源能够提高生产力。