什么是缓存穿刺和缓存雪崩?如何解决缓存穿透,缓存雪崩

本文探讨了缓存穿透和缓存雪崩的问题。缓存穿透是指查询不存在的数据导致每次请求都访问数据库,可通过布隆过滤器或缓存空对象来缓解。缓存雪崩则是大量缓存同时失效,导致数据库压力增大。解决方案包括加锁排队、数据预热、二级缓存策略等。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

作为参考使用,以便查阅。

一.缓存穿透:

     缓存穿透是指查询一个一定不存在的数据,由于缓存是不命中时需要从数据库查询,查不到数据则不写入缓存,这将导致这个不存在的数据每次请求都要到数据库去查询,造成缓存穿透。

     解决办法:

     1.布隆过滤

  对所有可能查询的参数以hash形式存储,在控制层先进行校验,不符合则丢弃。还有最常见的则是采用布隆过滤器,将所有可能存在的数据哈希到一个足够大的bitmap中,一个一定不存在的数据会被这个bitmap拦截掉,从而避免了对底层存储系统的查询压力。

  补充:

      Bloom filter

  适用范围:可以用来实现数据字典,进行数据的判重,或者集合求交集

  基本原理及要点:对于原理来说很简单,位数组+k个独立hash函数。将hash函数对应的值的位数组置1,查找时如果发现所有hash函数对应位都是1说明存在,很明显这个过程并不保证查找的结果是100%正确的。同时也不支持删除一个已经插入的关键字,因为该关键字对应的位会牵动到其他的关键字。所以一个简单的改进就是counting Bloom filter,用一个counter数组代替位数组,就可以支持删除了。添加时增加计数器,删除时减少计数器。

     2. 缓存空对象. 将 null 变成一个值.

  也可以采用一个更为简单粗暴的方法,如果一个查询返回的数据为空(不管是数 据不存在,还是系统故障),我们仍然把这个空结果进行缓存,但它的过期时间会很短,最长不超过五分钟。

 缓存空对象会有两个问题:

 第一,空值做了缓存,意味着缓存层中存了更多的键,需要更多的内存空间 ( 如果是攻击,问题更严重 ),比较有效的方法是针对这类数据设置一个较短的过期时间,让其自动剔除。

 第二,缓存层和存储层的数据会有一段时间窗口的不一致,可能会对业务有一定影响。例如过期时间设置为 5分钟,如果此时存储层添加了这个数据,那此段时间就会出现缓存层和存储层数据的不一致,此时可以利用消息系统或者其他方式清除掉缓存层中的空对象。

二.缓存雪崩

    如果缓存集中在一段时间内失效,发生大量的缓存穿透,所有的查询都落在数据库上,造成了缓存雪崩。

    这个没有完美解决办法,但可以分析用户行为,尽量让失效时间点均匀分布。大多数系统设计者考虑用加锁或者队列的方式保证缓存的单线程(进程)写,从而避免失效时大量的并发请求落到底层存储系统上。

 解决方法

   1. 加锁排队. 限流-- 限流算法. 1.计数 2.滑动窗口 3.  令牌桶Token Bucket 4.漏桶 leaky bucket [1]

 在缓存失效后,通过加锁或者队列来控制读数据库写缓存的线程数量。比如对某个key只允许一个线程查询数据和写缓存,其他线程等待。

 业界比较常用的做法,是使用mutex。简单地来说,就是在缓存失效的时候(判断拿出来的值为空),不是立即去load db,而是先使用缓存工具的某些带成功操作返回值的操作(比如Redis的SETNX或者Memcache的ADD)去set一个mutex key,当操作返回成功时,再进行load db的操作并回设缓存;否则,就重试整个get缓存的方法。

SETNX,是「SET if Not eXists」的缩写,也就是只有不存在的时候才设置,可以利用它来实现锁的效果。

     2.数据预热

  可以通过缓存reload机制,预先去更新缓存,再即将发生大并发访问前手动触发加载缓存不同的key,设置不同的过期时间,让缓存失效的时间点尽量均匀

  3.做二级缓存,或者双缓存策略。

     A1为原始缓存,A2为拷贝缓存,A1失效时,可以访问A2,A1缓存失效时间设置为短期,A2设置为长期。

   4.缓存永远不过期

 这里的“永远不过期”包含两层意思:

    (1) 从缓存上看,确实没有设置过期时间,这就保证了,不会出现热点key过期问题,也就是“物理”不过期。

     (2) 从功能上看,如果不过期,那不就成静态的了吗?所以我们把过期时间存在key对应的value里,如果发现要过期了,通过一个后台的异步线程进行缓存的构建,也就是“逻辑”过期.

 从实战看,这种方法对于性能非常友好,唯一不足的就是构建缓存时候,其余线程(非构建缓存的线程)可能访问的是老数据,但是对于一般的互联网功能来说这个还是可以忍受。

<think>好的,用户想了解缓存穿透缓存击穿缓存雪崩的定义、区别解决方案。首先,我需要回忆这三个概念的基本定义。根据引用[3],缓存穿透是查询不存在的数据,绕过缓存直接访问数据库;缓存击穿是热点key过期后大量请求直达数据库;缓存雪崩是大量key同时失效或Redis宕机导致数据库压力骤增。 接下来要区分它们的区别。根据引用[1][4],缓存击穿可以视为缓存雪崩的子集,但前者是单个或少量热点key失效,后者是大量key同时失效。而缓存穿透则是查询不存在的数据,无论key是否存在。需要明确这三者的不同场景影响范围。 解决方案方面,缓存穿透通常用布隆过滤器或空值缓存,引用[2][5]提到这些方法。缓存击穿可以用互斥锁或逻辑过期,引用[5]还提到多级缓存缓存雪崩则需要随机TTL、集群部署降级策略,引用[5]详细说明了这些方法。 需要确保回答结构清晰,先分别解释每个问题的定义解决方法,再对比区别。同时注意使用正确的中文表达LaTeX格式,比如变量用$...$,如TTL。还要检查引用标识是否正确对应,避免混淆。最后生成相关问题,帮助用户深入理解。</think>### 缓存穿透缓存击穿与缓存雪崩详解 #### 1. **缓存穿透** **定义**:查询数据库中**不存在的数据**(如无效ID),导致请求绕过缓存直接访问数据库。若恶意攻击者频繁发起此类请求,数据库压力剧增[^2][^3]。 **解决方案**: - **布隆过滤器**:预先存储所有合法key的哈希值,拦截无效请求(例如:$H(key) \rightarrow \text{位数组}$)。 - **空值缓存**:对无效查询结果缓存短时间(如$5\text{min}$),减少重复穿透[^5]。 - **请求校验**:在业务层过滤明显非法的参数(如负数的ID)。 --- #### 2. **缓存击穿** **定义**:**热点key过期瞬间**,大量并发请求直达数据库,导致数据库瞬时压力过大[^1][^4]。 **解决方案**: - **互斥锁(Mutex Lock)**:仅允许一个线程重建缓存,其他线程等待(例如使用Redis的`SETNX`命令)。 - **逻辑过期**:缓存数据中存储逻辑过期时间,异步更新缓存(例如:$t_{\text{expire}} = t_{\text{current}} + 300$)。 - **永不过期策略**:后台定时更新热点key,避免自动失效[^5]。 --- #### 3. **缓存雪崩** **定义**:**大量key同时失效**或Redis服务宕机,导致请求全部涌向数据库,可能引发级联故障。 **解决方案**: - **随机TTL**:为不同key设置差异化的过期时间(例如:$TTL = \text{基础值} + \text{随机数}$)[^5]。 - **Redis集群与哨兵模式**:通过高可用架构避免单点故障(如主从切换)。 - **多级缓存**:结合本地缓存(如JVM堆缓存)、Nginx缓存等分散压力。 - **降级限流**:在数据库压力过大时,暂时拒绝部分非核心请求。 --- ### 三者的区别 | 问题类型 | 触发条件 | 影响范围 | 核心特征 | |----------|----------------------------|------------------|-----------------------| | 穿透 | 查询不存在的数据 | 单个或少量key | 绕过缓存 | | 击穿 | 热点key过期 | 单个热点key | 瞬时高并发 | | 雪崩 | 大量key失效/Redis宕机 | 全局或大量key | 系统级压力 | --- ### 关联与扩展 - **缓存击穿是雪崩的子集**:若多个热点key同时失效,可能演变为雪崩。 - **防御组合策略**:实际场景中常综合使用布隆过滤器、多级缓存随机TTL。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值