高并发环境下qps计算

本文探讨了阿里Sentinel与Netflix Hystrix在高并发环境下如何计算QPS,重点介绍了Sentinel的分片策略,将时间分为若干片以降低锁的使用,提高性能。同时提到了LongAdder的使用,利用数据striping提升并发访问的吞吐量,避免传统加锁带来的性能瓶颈。

最近在研究阿里的一些中间件,最近看到了sentinel,由于和我们现在使用的统计-判断-预警-熔断有点类似,所以就深入了源码细看了一下,不看不要紧,一看吓一跳。我们现在的熔断的粒度是分钟级别的,没想到sentinel可以精细到任何级别,甚至是毫秒。我们姑且就按秒来说吧,一对比,就不是一个级别的了。


不说我们之前的架构了,还是说一下阿里sentinel使用的qps计算方法吧,给我印象最深刻的地方就是qps的计算模式了。


大家要知道,按qps为2000来算,每一毫秒就要有2个请求要处理,如果为了获取qps和并发环境下为了数据正确而加锁处理,那么会耗费很大的cpu资源。

而且若按curtime%1000作为key来统计请求数的话,假如当前时间为200ms,那么取得的qps则很有可能是总量的20%,那么肯定是不行的。

其实就是这么一个文件 https://github.com/Netflix/Hystrix/blob/master/hystrix-core/src/main/java/com/netflix/hystrix/util/HystrixRollingNumber.java


分片

首先sentinel采用的方法就是把一段时间分成若干片,如把1s分成10片,那么每片统计当前100ms内的数据,然后当前qps则为当前分片往前推10格,再求和,即为当前的qps。


那么问题来了,在分片的交接时刻,需要为新的分片创建对应的对象,若不加控制的话,直接加锁,会导致所有的线程等待(只有一个线程去创建当前bucket)。但sentinel的模式则是若发现要创建新的bucket,则让一个线程去创建,别的线程则取出上一个bucket进行处理(牺牲了一点时刻准确度,但换来了性能的大量提示)。


longadd

具体到某一个bucket时,需要对当前的bucket的value进行增加,传统的思路就是再对这个bucket的value进行加锁,那么这个地方就又回阻塞了,那么有没有好的办法的。肯定有啦,看sentinel的思路吧,其实就是用到了netflix的hytrixRollingNumber的办法(https://github.com/Netflix/Hystrix)。具体一点就是Striped64。


数据 striping 就是把逻辑上连续的数据分为多个段,使这一序列的段存储在不同的物理设备上。通过把段分散到多个设备上可以增加访问并发性,从而提升总体的吞吐量


在JDK 8中,已经添加到的 java.util.concurrent.atomic 下的 Striped64 了。


abstract class Striped64 extends Number {
    static final int NCPU = Runtime.getRuntime().availableProcessors();

     // 存放 Cell 的表。当不为空时大小是 2 的幂。
    transient volatile Cell[] cells;

     // base 值,在没有竞争时使用,也作为表初始化竞争时的一个后备。
    transient volatile long base;

     // 自旋锁,在 resizing 和/或 创建Cell时使用。
    transient volatile int cellsBusy;
}


@sun.misc.Contended static final class Cell {
     volatile long value;
     Cell(long x) { value = x; }
     final boolean cas(long cmp, long val) {
          return UNSAFE.compareAndSwapLong(this, valueOffset, cmp, val);
     }

     // Unsafe mechanics
     private static final sun.misc.Unsafe UNSAFE;
     private static final long valueOffset;
     static {
          try {
               UNSAFE = sun.misc.Unsafe.getUnsafe();
               Class<?> ak = Cell.class;
               valueOffset = UNSAFE.objectFieldOffset
                    (ak.getDeclaredField("value"));
          } catch (Exception e) {
               throw new Error(e);
          }
     }
}

看上面的注释应该就能看懂了吧,思路就是把锁的粒度变小,刚好这种思路是非常适合处理qps的。当然真实的value就是Striped64.value + Cell[0-n].value之和的,所以这种设计思路可以达到写基本是O(1)的,读会耗电cpu。但正是我们想要的了。





在压力测试中计算每秒查询数(Queries Per Second,QPS)时,核心目标是衡量系统在单位时间内能够处理的请求数量。这一指标常用于评估服务器性能,特别是在高并发场景下的响应能力。 ### QPS 的基本定义与计算方法 QPS 表示每秒可以完成的请求数,其计算公式如下: $$ \text{QPS} = \frac{\text{总请求数}}{\text{测试时间(秒)}} $$ 例如,在一个持续时间为 60 秒的压力测试中,如果系统总共处理了 12,000 个请求,则 QPS 为: ```python qps = 12000 / 60 # 输出:200 ``` 这意味着系统平均每秒处理了 200 个请求。 ### 考虑并发量与平均响应时间的关系 QPS 也可以通过并发量和平均响应时间之间的关系进行推导: $$ \text{QPS} = \frac{\text{并发量}}{\text{平均响应时间}} $$ 假设测试过程中有 500 个并发请求,每个请求的平均响应时间为 2.5 秒,则: ```python qps = 500 / 2.5 # 输出:200 ``` 这表明系统在该负载下仍能维持每秒 200 个请求的处理能力[^1]。 ### 实际测试中的统计方法 在实际测试环境中,可以通过日志文件或监控工具来统计 QPS。例如,在 Linux 系统中,可以通过分析日志文件并提取特定时间戳的信息来计算每秒的请求数量: ```bash # 假设日志格式中包含时间戳,且每行代表一个请求 cat access.log | awk '{print $4}' | cut -d: -f2 | sort | uniq -c | sort -nr | head -n 10 ``` 此命令会输出每分钟内每秒钟的请求计数,从而帮助估算 QPS。 此外,还可以使用专门的压测工具如 `ab` (Apache Bench)、`wrk` 或 `JMeter` 来直接获取 QPS 指标。例如,使用 `ab` 工具进行测试的命令如下: ```bash ab -n 10000 -c 500 http://example.com/ ``` 其中 `-n` 表示总请求数,`-c` 表示并发用户数。执行完成后,`ab` 会输出包括 QPS 在内的多个性能指标。 ### 总结 在压力测试中,QPS 是衡量系统吞吐能力的重要指标。可以通过以下方式计算1. **基于总请求数与测试时间**: ```python qps = total_requests / test_duration_seconds ``` 2. **基于并发量与平均响应时间**: ```python qps = concurrent_users / average_response_time ``` 结合实际环境中的日志分析工具或压测工具,可以更精确地获取 QPS 数据,并据此优化系统性能。 ---
评论 2
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值