百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

图解常见的限流算法(计数器、滑动窗口计数、漏桶、令牌桶)

mhr18 2025-04-06 18:23 18 浏览 0 评论

哈喽,大家好呀,我是呼噜噜,好久没有更新文章了,今天我们来聊聊在企业级项目中,常见的几种限流手段的原理及其实现

什么场景需要限流

随着互联网的业务发展,比如秒杀、双十一、618等这些我们耳熟能详,也有被人恶意攻击的场景下,系统往往经受被高并发流量冲垮的风险,这个时候可以采用限流的方式,来保护自身的系统以及下游系统,当然还有其他各种方式手段,比如熔断、降级、隔离等,本文将重点来讲讲限流

限流就是就是对请求或并发数进行限制,通过在一定时间内对请求量进行限制,来达到保护系统正常运行的目的。常见的限流算法,有计数器算法、滑动窗口计数算法、漏桶算法、令牌桶算法

计数器算法

计数器算法,通过计数器在周期内累加访问次数,并规定一个周期(时间窗口)内的系统处理的请求数量(阈值),当在一个周期内,计数的值达到限流阈值时触发拒绝策略;到下一周期计数器就重置为0,重新开始计数,它是一种简单方便的限流算法

比如我们设置系统的阈值1s中最多请求100次,在计数器算法中,我们需要把时间划分固定大小窗口(所以计数器算法又叫固定窗口算法Fixed Window),这里我们将1s划分为一个时间窗口;然后用计数器来记录在每个时间窗口的处理的请求数量,如果请求数量超过100次,后续的请求会被直接拒绝,直到1s结束后,重新开始计数

计数器算法优点实现简单, 占用内存小,性能较高,但是有一个缺点,就是临界问题,因为在一个时间窗口中,请求或者流量并不是均匀分布的,比如,在1.9s和2.1s的时间点,分别被人恶意并发请求了100次,也就是说从1.9s开始后的1s时间窗口期间,被瞬间请求了200次已经超过系统的阈值了,即使窗口2和窗口3还是正常的,这样可能会导致系统直接挂掉

这里提供一个简单的demo(Java版,其他语言大家自行改写):

public class MyFixedWindowRateLimiterDemo {
    // 阈值
    private static Integer QPS = 2;
    // 时间窗口(毫秒)
    private static long TIME_WINDOWS = 1000;
    // 计数器
    private static AtomicInteger counter = new AtomicInteger();

    //上一个窗口的开始时间
    private static long START_TIME = System.currentTimeMillis();

    public synchronized static boolean tryAcquire() {
        if ((System.currentTimeMillis() - START_TIME) > TIME_WINDOWS) {
            counter.set(0);
            START_TIME = System.currentTimeMillis();
        }
        return counter.incrementAndGet() <= QPS;
    }

    public static void main(String[] args) throws InterruptedException {
        for (int i = 0; i < 10; i++) {
            Thread.sleep(250);
            LocalTime now = LocalTime.now();
            if (!tryAcquire()) {
                System.out.println(now + " 请求被限流");
            } else {
                System.out.println(now + " 请求通过");
            }
        }
    }
}

滑动窗口计数算法

滑动窗口算法(Sliding Window)出现于网络协议中传输层,是一种流量控制技术。我们这里对计数器(固定窗口)算法的临界问题,滑动窗口算法进行了改进,不再固定窗口大小,而是将把固定窗口近一步划分成多个小周期,每个周期都记录自己的请求访问次数,随着时间流逝,滑动时间窗口(每次向后移动一周期),同时删除过期的小周期。每次判断限流时,需要将一个窗口的所有小周期合起来,再与阈值进行比较

举个例子,上图我们将1s时间窗口,划分成5个200ms的小周期,记录每个周期的请求访问次数,这里沿用上一小节的情形在1.9s和2.1s的时间点,分别被人恶意并发请求了100次,当滑动到第5个小周期时,访问量为100次,未达到阈值;而当窗口滑动到第6个小周期时,访问数量变为:200,这个时候会超过阈值,触发拒绝访问的限制

这样就能限制住瞬时流量爆发。如果滑动窗口的单位区间划分越细的话,滑动窗口的滚动就越平滑,限流统计也会越精准。但随着而来的是实现滑动窗口算法,需要更多的存储空间。另外计数器算法实现起来比较简单,滑动窗口则更复杂

这里提供一个笔者感觉非常简单明了的demo,参考于简单的java实现滑动时间窗口限流算法,在此感谢

public class MySlidingWindowRateLimiterDemo {

    /** 队列id和队列的映射关系,队列里面存储的是每一次通过时候的时间戳,这样可以使得程序里有多个限流队列 */
    private volatile static Map<String, List> MAP = new ConcurrentHashMap<>();
    
    //阈值
    private static int QPS = 2;
    //时间窗口总大小(毫秒)
    private static long WindowSize = 10 * 1000;


    /**
     * 滑动时间窗口限流算法
     * 在指定时间窗口,指定限制次数内,是否允许通过
     *
     * @param listId     队列id
     * @param count      限制次数
     * @param timeWindow 时间窗口大小
     * @return 是否允许通过
     */
    public static synchronized boolean tryAcquire(String listId, int count, long timeWindow) {
        // 获取当前时间
        long nowTime = System.currentTimeMillis();
        // 根据队列id,取出对应的限流队列,若没有则创建
        List list = MAP.computeIfAbsent(listId, k -> new LinkedList<>());
        // 如果队列还没满,则允许通过,并添加当前时间戳到队列开始位置
        if (list.size() < count) {
            list.add(0, nowTime);
            return true;
        }

        // 队列已满(达到限制次数),则获取队列中最早添加的时间戳
        Long farTime = list.get(count - 1);
        // 用当前时间戳 减去 最早添加的时间戳
        if (nowTime - farTime <= timeWindow) {
            // 若结果小于等于timeWindow,则说明在timeWindow内,通过的次数大于count
            // 不允许通过
            return false;
        } else {
            // 若结果大于timeWindow,则说明在timeWindow内,通过的次数小于等于count
            // 允许通过,并删除最早添加的时间戳,将当前时间添加到队列开始位置
            list.remove(count - 1);
            list.add(0, nowTime);
            return true;
        }
    }

    public static void main(String[] args) throws InterruptedException {
        for (int i = 0; i < 20; i++) {
            Thread.sleep(1000);
            LocalTime now = LocalTime.now();
            if (!tryAcquire("ip", QPS, WindowSize)) {// 任意10秒内,只允许2次通过;自定义限流规则“ip”
                System.out.println(now + " 请求被限流");
            } else {
                System.out.println(now + " 请求通过");
            }
        }
    }
}

美中不足的是,在滑动窗口算法,窗口中流量到达阈值时,流量会瞬间切断,而现实中我们还是更希望,让流量跟平滑地放行到系统中,而不是简单粗暴地将其掐断

漏桶算法

我们再来看看漏桶算法Leaky Bucket,是一个非常贴切的比喻,意思是,水(就是请求/流量)从进水口(生产端)进入(队列)中,这个桶是漏的(比方说桶底有一个孔),以一定的速度漏水(消费端不断的在消费队列中的请求),当水进入桶的速度过大(大于漏水的速度),会导致桶里的水堆积,当超过桶容量时会溢出来(请求被拒绝)。从而实现网络流量整形和限流的功能

这里漏水的速度其实就是限流的阈值,所谓的阈值,表示在一个单位时间内允许的请求量,比如如QPS为100,说明1秒内系统最多可以消费100个请求。如果生产端的速率超过阈值的话,请求会慢慢堆积,又因为漏桶的容量是固定的,最后会触发拒绝策略(溢出)

漏桶算法它的优点是,实现起来简单,很容易理解。它可以严格限制请求的处理速度,一旦超过该速度就拒绝服务,从而避免网络拥塞和系统过载

但它也有缺点:

  1. 即使没有大流量,也求需要等待漏桶处理完成(流量限制过于严格),这样就会导致请求处理延迟,不适用于实时性要求很高的场景
  2. 由于它请求的处理速度是固定的,哪怕网络没有发生拥塞时,也不能使某一个单独的数据流达到生产端的速率,也无法很好地应对突发特性的流量,不能充分利用系统资源

这里提供一个简单的demo(不完整,生产慎用,仅用来演示):

public class MyLeakyBucketRateLimiterDemo {
    // 桶的容量
    private final int capacity;
    // 漏出速率
    private final int rate;
    // 剩余水量
    private long leftWater;
    // 上次注入时间
    private long timeStamp = System.currentTimeMillis();

    public MyLeakyBucketRateLimiterDemo(int rate, int capacity) {
        this.capacity = capacity;
        this.rate = rate;
    }

    public synchronized boolean tryAcquire() {
        //1. 计算剩余水量
        long now = System.currentTimeMillis();
        long timeGap = (now - timeStamp) / 1000;
        leftWater = Math.max(0, leftWater - timeGap * rate);
        timeStamp = now;

        // 如果未满,则放行;否则限流
        if (leftWater < capacity) {
            leftWater += 1;
            return true;
        }
        return false;
    }


    public static void main(String[] args) throws InterruptedException {
        MyLeakyBucketRateLimiterDemo limiterDemo = new MyLeakyBucketRateLimiterDemo(2,5);
        for (int i = 0; i < 10; i++) {
            Thread.sleep(500);
            LocalTime now = LocalTime.now();
            if (!limiterDemo.tryAcquire()) {
                System.out.println(now + " 请求被限流");
            } else {
                System.out.println(now + " 请求通过");
            }
        }
    }
}

令牌桶算法

令牌桶算法是漏桶算法的改进版,是网络流量整形(Traffic Shaping)和限流(Rate Limiting)中最常使用的一种算法,它也有一个桶,现在用来存放固定数量的令牌(token),该算法会以一定的速率(阈值)往桶中发放令牌。每次请求都需要先获取到桶中的一个令牌才能继续执行,请求处理完毕之后将这个令牌丢弃,否则执行拒绝策略(一般有直接拒绝、排队等待 等);另外放令牌的动作是持续不断进行的,如果桶装满了,则丢弃令牌

表面上看,令牌桶算法和漏桶算法是相反的,一个"进水",一个是"漏水"。但与漏桶算法实际不同的是,令牌桶不仅能够在限制客户端请求流量速率的同时还能允许一定程度的突发流量限流和允许瞬时流量其实并不矛盾,在大多数场景中,小批量的突发流量系统是完全可以接受的

因为令牌桶算法中,发放令牌是持续不间断的,当流量一直比较缓和时,桶能够一直持有冗余的令牌,以应对突发流量。如果这时突发大流量,形成流量尖峰,这些请求进来可以直接拿到令牌去执行。只有超越系统阈值的流量,由于未获得桶中的令牌,请求只能等待或者被拒绝,从而维护系统的稳定。

当然相较于漏桶算法,令牌桶算法,实现更为复杂,需要维护令牌的生成和消耗,还需要精确的时间控制(不然会影响限流的效果),需要消耗更多的内存来储存令牌

这里也提供一下代码实现,单机下推荐使用(或者仿写)Google Guava自带的限流工具类RateLimiter

先引入依赖:


    com.google.guava
    guava
    30.0-jre

设置发放令牌的速率,然后直接调用tryAcquire,大家感兴趣地可以看看其源码实现

public class MyTokenBucketRateLimiterDemo {
    public static void main(String[] args) throws InterruptedException {
        // 每1s发放5个令牌到桶里
        RateLimiter rateLimiter = RateLimiter.create(5);
        for (int i = 0; i < 10; i++) {
            Thread.sleep(100L);
            if(rateLimiter.tryAcquire()) {
                System.out.println("get one token");
            }else {
                System.out.println("no token");
            }
        }
    }
}

补充:分布式限流

本文上述提供的例子,仅适用于单机,如果是多机部署(分布式)场景下,算法还是可以采用上述算法,需要通过中间件将限流算法的参数信息(比如令牌桶、计数器等)改成存储全局化,比如采用redis+lua的方式实现,或者使用开源工具比如redisson(内部封装了基于Redis的限流)、Sentinel(带有监控监控平台)等

或者我们也可以利用nginx来从上层流量入口进行限流,它提供2个限流模块ngx_http_limit_req_module,
ngx_http_limit_conn_module

上述几种限流算法都是业内常见的,各有优劣,我们需要理解每种方案的工作原理和特性,这样可以能更好地根据项目具体的情况和多种因素,选择合适的方案

全文完,感谢您的阅读,点赞收藏在看就是对笔者最好的催更

我们下期再见~



作者:小牛呼噜噜 ,关注公众号「小牛呼噜噜」,更多高质量好文等你!

相关推荐

【推荐】一个开源免费、AI 驱动的智能数据管理系统,支持多数据库

如果您对源码&技术感兴趣,请点赞+收藏+转发+关注,大家的支持是我分享最大的动力!!!.前言在当今数据驱动的时代,高效、智能地管理数据已成为企业和个人不可或缺的能力。为了满足这一需求,我们推出了这款开...

Pure Storage推出统一数据管理云平台及新闪存阵列

PureStorage公司今日推出企业数据云(EnterpriseDataCloud),称其为组织在混合环境中存储、管理和使用数据方式的全面架构升级。该公司表示,EDC使组织能够在本地、云端和混...

对Java学习的10条建议(对java课程的建议)

不少Java的初学者一开始都是信心满满准备迎接挑战,但是经过一段时间的学习之后,多少都会碰到各种挫败,以下北风网就总结一些对于初学者非常有用的建议,希望能够给他们解决现实中的问题。Java编程的准备:...

SQLShift 重大更新:Oracle→PostgreSQL 存储过程转换功能上线!

官网:https://sqlshift.cn/6月,SQLShift迎来重大版本更新!作为国内首个支持Oracle->OceanBase存储过程智能转换的工具,SQLShift在过去一...

JDK21有没有什么稳定、简单又强势的特性?

佳未阿里云开发者2025年03月05日08:30浙江阿里妹导读这篇文章主要介绍了Java虚拟线程的发展及其在AJDK中的实现和优化。阅前声明:本文介绍的内容基于AJDK21.0.5[1]以及以上...

「松勤软件测试」网站总出现404 bug?总结8个原因,不信解决不了

在进行网站测试的时候,有没有碰到过网站崩溃,打不开,出现404错误等各种现象,如果你碰到了,那么恭喜你,你的网站出问题了,是什么原因导致网站出问题呢,根据松勤软件测试的总结如下:01数据库中的表空间不...

Java面试题及答案最全总结(2025版)

大家好,我是Java面试陪考员最近很多小伙伴在忙着找工作,给大家整理了一份非常全面的Java面试题及答案。涉及的内容非常全面,包含:Spring、MySQL、JVM、Redis、Linux、Sprin...

数据库日常运维工作内容(数据库日常运维 工作内容)

#数据库日常运维工作包括哪些内容?#数据库日常运维工作是一个涵盖多个层面的综合性任务,以下是详细的分类和内容说明:一、数据库运维核心工作监控与告警性能监控:实时监控CPU、内存、I/O、连接数、锁等待...

分布式之系统底层原理(上)(底层分布式技术)

作者:allanpan,腾讯IEG高级后台工程师导言分布式事务是分布式系统必不可少的组成部分,基本上只要实现一个分布式系统就逃不开对分布式事务的支持。本文从分布式事务这个概念切入,尝试对分布式事务...

oracle 死锁了怎么办?kill 进程 直接上干货

1、查看死锁是否存在selectusername,lockwait,status,machine,programfromv$sessionwheresidin(selectsession...

SpringBoot 各种分页查询方式详解(全网最全)

一、分页查询基础概念与原理1.1什么是分页查询分页查询是指将大量数据分割成多个小块(页)进行展示的技术,它是现代Web应用中必不可少的功能。想象一下你去图书馆找书,如果所有书都堆在一张桌子上,你很难...

《战场兄弟》全事件攻略 一般事件合同事件红装及隐藏职业攻略

《战场兄弟》全事件攻略,一般事件合同事件红装及隐藏职业攻略。《战场兄弟》事件奖励,事件条件。《战场兄弟》是OverhypeStudios制作发行的一款由xcom和桌游为灵感来源,以中世纪、低魔奇幻为...

LoadRunner(loadrunner录制不到脚本)

一、核心组件与工作流程LoadRunner性能测试工具-并发测试-正版软件下载-使用教程-价格-官方代理商的架构围绕三大核心组件构建,形成完整测试闭环:VirtualUserGenerator(...

Redis数据类型介绍(redis 数据类型)

介绍Redis支持五种数据类型:String(字符串),Hash(哈希),List(列表),Set(集合)及Zset(sortedset:有序集合)。1、字符串类型概述1.1、数据类型Redis支持...

RMAN备份监控及优化总结(rman备份原理)

今天主要介绍一下如何对RMAN备份监控及优化,这里就不讲rman备份的一些原理了,仅供参考。一、监控RMAN备份1、确定备份源与备份设备的最大速度从磁盘读的速度和磁带写的带度、备份的速度不可能超出这两...

取消回复欢迎 发表评论: