从0到1理解Sentinel限流：算法、计数与时间窗口的精妙协作-优快云博客

从0到1理解Sentinel限流：算法、计数与时间窗口的精妙协作

【免费下载链接】source-code-hunter 😱 从源码层面，剖析挖掘互联网行业主流技术的底层实现原理，为广大开发者 “提升技术深度” 提供便利。目前开放 Spring 全家桶，Mybatis、Netty、Dubbo 框架，及 Redis、Tomcat 中间件等项目地址: https://gitcode.com/doocs/source-code-hunter

你是否曾遇到过这样的困境：系统在正常流量下运行平稳，却在促销活动或突发流量时瞬间崩溃？作为分布式系统的"安全阀"，限流技术是保障服务稳定性的核心手段。本文将深入剖析Sentinel——这款阿里开源的流量治理框架，如何通过三大核心组件（限流算法、高效计数、滑动时间窗口）构建起坚固的流量防线。读完本文，你将掌握：令牌桶与漏桶算法的实现差异、高并发场景下的计数优化方案，以及滑动时间窗口如何精准控制流量。

限流算法：流量控制的"大脑"

Sentinel实现了两种经典限流算法，分别应对不同的流量治理场景。漏桶算法通过严格控制流出速率，确保系统处理请求的平稳性；令牌桶算法则允许一定程度的流量突发，更适合应对实际业务中的流量波动。

漏桶算法：匀速流出的"稳压器"

漏桶算法通过RateLimiterController实现，其核心思想是：无论流入速率如何变化，系统始终以固定速率处理请求。当请求到达速率超过处理速率时，多余请求将被排队或直接拒绝。

@Override
public boolean canPass(Node node, int acquireCount, boolean prioritized) {
    if (acquireCount <= 0) {
        return true;
    }

    if (count <= 0) {
        return false;
    }

    long currentTime = TimeUtil.currentTimeMillis();
    // 计算两次请求之间的最小时间间隔
    long costTime = Math.round(1.0 * (acquireCount) / count * 1000);
    long expectedTime = costTime + latestPassedTime.get();

    if (expectedTime <= currentTime) {
        latestPassedTime.set(currentTime);
        return true;
    } else {
        long waitTime = expectedTime - currentTime;
        if (waitTime > maxQueueingTimeMs) {
            return false;
        } else {
            // 尝试更新通过时间
            long oldTime = latestPassedTime.addAndGet(costTime);
            // 省略后续实现...
        }
    }
    return false;
}

完整实现代码

上述代码中，costTime计算了处理请求所需的最小时间间隔，expectedTime则是下一次请求允许通过的最早时间。通过这种机制，漏桶算法严格控制了请求的流出速率，有效防止系统被突发流量冲垮。

令牌桶算法：应对突发的"弹性阀门"

令牌桶算法通过WarmUpController实现，相比漏桶算法更加灵活。系统以固定速率往桶中放入令牌，请求需要获取令牌才能通过。当桶中令牌积累到一定数量时，允许一定程度的流量突发，这更符合实际业务场景中的流量特征。

令牌桶算法原理示意图

核心实现代码如下：

// 初始化警戒令牌数和最大令牌数
warningToken = (int)(warmUpPeriodInSec * count) / (coldFactor - 1);
maxToken = warningToken + (int)(2 * warmUpPeriodInSec * count / (1.0 + coldFactor));
slope = (coldFactor - 1.0) / count / (maxToken - warningToken);

@Override
public boolean canPass(Node node, int acquireCount, boolean prioritized) {
    long passQps = (long) node.passQps();
    long previousQps = (long) node.previousPassQps();
    syncToken(previousQps);
    
    long restToken = storedTokens.get();
    if (restToken >= warningToken) {
        // 计算当前允许的QPS
        double warningQps = Math.nextUp(1.0 / (aboveToken * slope + 1.0 / count));
        return passQps + acquireCount <= warningQps;
    } else {
        return passQps + acquireCount <= count;
    }
}

完整实现代码

当剩余令牌数超过警戒值时，系统会通过slope斜率动态调整允许的QPS，实现从低流量到高流量的平滑过渡，这个过程称为"预热"。这种设计既避免了系统冷启动时被瞬间流量击垮，又能在流量稳定后充分利用系统资源。

高效计数：LongAdder的并发优化

在高并发场景下，准确统计请求数量是限流的基础。Sentinel采用LongAdder实现高性能计数，相比传统的AtomicLong，在高并发下具有更好的性能表现。

LongAdder的核心原理

LongAdder通过内部维护一个Cell数组，将热点数据分散存储，有效减少了并发竞争。每个线程通过hash计算映射到不同的Cell，更新操作只对该Cell进行，大幅降低了CAS操作的冲突概率。

transient volatile Cell[] cells;
transient volatile long base;

public long sum() {
    long sum = base;
    Cell[] as = cells;
    if (as != null) {
        for (int i = 0; i < as.length; ++i) {
            Cell a = as[i];
            if (a != null) sum += a.value;
        }
    }
    return sum;
}

完整实现代码

内存填充优化

为了避免缓存行伪共享问题，Cell类采用了内存填充技术：

volatile long p0, p1, p2, p3, p4, p5, p6;
volatile long value;
volatile long q0, q1, q2, q3, q4, q5, q6;

通过在value前后添加多个long类型字段，确保每个Cell对象独占一个缓存行，避免了多线程访问时的缓存失效问题，进一步提升了并发性能。

时间窗口：精准计量的"刻度标尺"

Sentinel采用滑动时间窗口实现流量的精准计量，通过LeapArray类管理时间窗口，确保在高并发场景下的准确性和性能。

滑动时间窗口实现原理

LeapArray的核心数据结构如下：

// 存储时间窗口的数组
protected final AtomicReferenceArray<WindowWrap<T>> array;
// 更新锁，用于重置过期窗口
private final ReentrantLock updateLock = new ReentrantLock();

public WindowWrap<T> currentWindow(long timeMillis) {
    // 计算当前窗口的索引
    int idx = calculateTimeIdx(timeMillis);
    // 计算窗口的开始时间
    long windowStart = calculateWindowStart(timeMillis);
    
    while (true) {
        WindowWrap<T> old = array.get(idx);
        if (old == null) {
            // 创建新窗口并通过CAS设置
            WindowWrap<T> window = new WindowWrap<T>(windowLengthInMs, windowStart, newEmptyBucket());
            if (array.compareAndSet(idx, null, window)) {
                return window;
            } else {
                Thread.yield();
            }
        } else if (windowStart == old.windowStart()) {
            // 窗口未过期，直接返回
            return old;
        } else if (windowStart > old.windowStart()) {
            // 窗口已过期，需要重置
            if (updateLock.tryLock()) {
                try {
                    return resetWindowTo(old, windowStart);
                } finally {
                    updateLock.unlock();
                }
            } else {
                Thread.yield();
            }
        } else {
            // 这种情况理论上不可能发生
            return new WindowWrap<T>(windowLengthInMs, windowStart, newEmptyBucket());
        }
    }
}

完整实现代码

窗口滑动机制

默认情况下，Sentinel使用秒级和分钟级两级时间窗口：

秒级窗口：数组大小为2，每个窗口500ms，实现1秒内的滑动窗口
分钟级窗口：数组大小为60，每个窗口1秒，实现1分钟内的滑动窗口

通过这种分级设计，Sentinel既能精准控制短期流量，又能统计长期趋势，为限流决策提供了准确的数据基础。

实战应用：Sentinel限流配置示例

基于上述核心原理，我们可以通过简单配置实现不同场景下的限流需求：

// 配置限流规则
List<FlowRule> rules = new ArrayList<>();
FlowRule rule = new FlowRule();
rule.setResource("orderService");
// 限流阈值
rule.setCount(100);
// 限流阈值类型为QPS
rule.setGrade(RuleConstant.FLOW_GRADE_QPS);
// 使用令牌桶算法
rule.setControlBehavior(RuleConstant.CONTROL_BEHAVIOR_WARM_UP);
// 预热时间为5秒
rule.setWarmUpPeriodSec(5);
rules.add(rule);
FlowRuleManager.loadRules(rules);

更多配置示例

通过调整controlBehavior参数，可以在不同限流算法之间切换；通过设置warmUpPeriodSec可以配置令牌桶算法的预热时间，实现系统的平滑启动。

总结与展望

Sentinel通过限流算法、高效计数和滑动时间窗口三大核心组件，构建了一个功能完善、性能优异的流量治理框架。其底层实现细节，如LongAdder的并发优化、滑动窗口的精准控制等，都体现了对高并发场景的深刻理解。

随着云原生时代的到来，流量治理将面临更多挑战。Sentinel作为一款优秀的开源框架，未来还将在动态规则配置、流量预测等方面不断演进，为微服务架构提供更强大的保障。

官方文档 | 更多框架源码解析

如果你觉得本文对你有帮助，欢迎点赞、收藏、关注，后续将带来更多开源项目的深度剖析。下期预告：Spring Cloud Gateway的路由转发机制。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考