P99 延迟(Percentile-99,99 百分位延迟)的含义是:
在所有请求中,99% 的请求的响应时间都 ≤ 该值,只有 1% 的请求会超过它。
举个例子
-
你在一小时内记录了 10,000 次 API 调用耗时。
-
把这些耗时从小到大排序,取第 9,900 个值(99% 位置),这个值就是 P99 延迟。
-
如果 P99 = 120 ms,说明 只有 100 次(1%)请求超过 120 ms,其余 9,900 次都在 120 ms 以内。
为什么用 P99 而不是平均延迟?
-
平均延迟容易被少量极慢请求拉高,不能反映真实用户体验。
- P99(或 P95、P99.9) 能捕捉“长尾”问题,比如:
-
GC 抖动(如 Go、Java)。
-
网络偶发超时。
-
锁竞争或缓存未命中。
-
在量化或高频中的意义
-
低延迟系统通常关注 P99.9 甚至 P99.99(万分之一)。
- 例如:
-
交易所撮合引擎 P99 要求 < 50 µs,P99.9 要求 < 100 µs。
-
策略信号 P99 延迟决定了滑点风险。
-
一句话总结:
P99 延迟 = 99% 用户不会感受到比它更慢的“安全线”,是衡量系统稳定性和用户体验的核心指标。