缓存穿透、雪崩、热点与Redis

本文探讨了大规模系统中缓存穿透及雪崩等问题,提出了空对象与布隆过滤器等解决方案,并讨论了缓存热点key重建策略。通过互斥锁与永远不过期等方法减轻后端负载。
首发于 轻境界:  https://www.qingjingjie.com/b...

向大家推荐这篇文章——Redis架构之防雪崩设计:网站不宕机背后的兵法

(另外推荐我去年的短文作为餐前点心——略谈服务端缓存设计

《Redis架构之防雪崩设计》这篇文章(下文称之为“原文”)写得非常好,全面概括了大规模系统可能面对的缓存穿透和缓存雪崩等问题,可以看出是一线实战经验的精华总结,非常适合大家学习。

而我想再补充一些信息,使“原文”的版图更加完整。

关于“缓存穿透”

“原文”给出了空对象和布隆过滤器两种解决方案。

空对象是首选方案,简单直接,碰到查询结果为空的键,放一个空值在缓存中,下次再访问就立刻知道这个键无效,不用发出SQL了。但“原文”也说了,存在如下问题:

第一,空值做了缓存,意味着缓存层中存了更多的键,需要更多的内存空间 ( 如果是攻击,问题更严重 ),比较有效的方法是针对这类数据设置一个较短的过期时间,让其自动剔除。

第二,缓存层和存储层的数据会有一段时间窗口的不一致,可能会对业务有一定影响。例如过期时间设置为 5 分钟,如果此时存储层添加了这个数据,那此段时间就会出现缓存层和存储层数据的不一致,此时可以利用消息系统或者其他方式清除掉缓存层中的空对象。

对于第一点,我还建议空值放在另外的缓存空间中,不宜与正常值共用空间,否则当空间不足时,缓存系统的LRU算法可能会先剔除正常值,再剔除空值——这个漏洞可能会受到攻击。

对于第二点,如果是Redis缓存,更新数据后直接在Redis中清除即可;如果是本地缓存,就需要用消息来通知其他机器清除各自的本地缓存了。(业界终于接受了用消息来同步缓存的设计思想,cheers! )我有一个小项目joint-cache-redis来简单地演示“用消息来同步多个机器的缓存”,而且在实践中发现Kafka可能比Redis MQ更适合于这个场景。

关于“缓存雪崩”

这句概括很传神!缓存层宕掉后,流量会像奔逃的野牛一样,打向后端存储

没什么要补充的,就感谢一下Netflix开源的Hystrix吧!虽然只是一个库,但是要实现可靠的限流算法还是颇有门道的。

关于“缓存热点 key 重建”

“原文”说到在缓存失效的瞬间,有大量线程来重建缓存,造成后端负载加大,甚至可能会让应用崩溃,并给出“互斥锁”和“永远不过期”两种候选方案。

互斥锁(Mutex):

“分布式缓存加锁”通常是一个反模式(见我去年的文章大型服务端开发的反模式第7条),如果持有锁的实例不稳定导致没及时释放,就会浪费这个锁,直到锁过期。“原文”的作者还指出有死锁的风险。

其实是可以优化的:等待一两次后,重试时可绕过互斥锁。即使绕过互斥锁,也不会产生什么不好的后果,因为更新缓存是一个幂等操作。

也可以把锁的过期时间设得更短。

从这个例子我们能感觉到,幂等操作比非幂等操作更容易优化。

永远不过期:

"原文"很好地介绍了在Redis中的做法。对于Guava本地缓存就简单多了,使用refreshAfterWrite即可。

“原文”读到最后,才知道这是《Redis开发与运维》一书的节选,相信这本书会是国产技术书籍的精品!

转自:https://segmentfault.com/a/1190000008931971

<think>首先,用户的问题是关于Redis缓存中的穿透雪崩问题的解决方案。我需要基于提供的引用内容来回答。 关键引用: - 引用[1]:提到缓存击穿的解决方案,包括防止接口并发行为、让缓存永不过期、分级缓存架构(本地缓存+Redis集群)、热点发现、熔断降级、异步更新。 - 引用[2]:解释缓存雪崩是大量数据同时失效导致数据库压力过大,解决方法包括设置不同过期时间。 - 引用[3]:讨论缓存击穿,如果不设置过期时间就不会有问题,但可能导致内存占用;建议逻辑过期方案。 - 引用[4]:描述缓存击穿的处理,使用互斥锁防止多个线程同时查询数据库。 用户的问题是“Redis缓存穿透雪崩的解决方案”,所以我需要覆盖穿透雪崩,但引用中也提到了击穿。用户指定了穿透雪崩,所以我应该专注于这两个。 - 缓存穿透:查询不存在的数据,导致每次请求都打到数据库。 - 缓存雪崩:大量缓存数据同时失效,导致请求涌向数据库。 现在,结构我的回答: 1. **解释问题**:简要解释什么是缓存穿透雪崩。 2. **提供解决方案**:基于引用,给出具体的解决方案。 3. **使用中文**:所有内容用中文。 4. **遵守格式**: - 行内数学表达式用$...$,但这里可能不需要数学表达式,因为主题是Redis缓存。 - 独立公式用$$...$$,但同样,可能不适用。 - 确保LaTeX语法正确。 - 生成相关问题。 - 在引用段落末尾添加引用标识,如[^1]。 回答结构: - 清晰、逐步解决问题。 - 引用相关部分时添加标识。 最终回答包括: - 回答部分。 - 相关问题部分。 步骤: 1. **介绍缓存穿透**: - 定义:查询不存在的数据,导致数据库压力。 - 解决方案:基于引用[1]和[3],使用布隆过滤器、缓存空值等。 2. **介绍缓存雪崩**: - 定义:大量缓存同时失效。 - 解决方案:基于引用[2],设置随机过期时间、热点数据续期等。 3. **综合方案**:基于引用[1],建议分级缓存、熔断降级等。 生成相关问题: - 例如:1. 如何实现布隆过滤器来防止缓存穿透?2. 什么是缓存击穿及其解决方案?3. Redis缓存的其他常见问题有哪些? 引用添加: - 在相关句子末尾添加[^n]。 例如: - "为了防止缓存穿透,可以使用布隆过滤器来过滤无效查询[^1]." 确保回答真实可靠:基于提供的引用,不要添加外部知识。</think>### Redis缓存穿透雪崩的解决方案 Redis缓存是提升应用性能的关键组件,但处理不当可能引发问题。缓存穿透雪崩是常见问题,会导致数据库压力过大甚至服务崩溃。以下我将基于可靠引用,逐步解释问题并提供解决方案,确保内容清晰、实用。 #### 1. **缓存穿透的解决方案** **问题定义**:缓存穿透是指查询一个不存在的数据(如无效ID),导致请求直接绕过缓存打到数据库。如果频繁发生,数据库可能被压垮[^1]。 **解决方案**: - **布隆过滤器(Bloom Filter)**:在查询前,使用布隆过滤器过滤无效key。布隆过滤器是一种概率型数据结构,能高效判断key是否存在。如果过滤器返回不存在,则直接拒绝请求,避免数据库访问[^1]。 - **缓存空值**:对于查询结果为空的key,将其缓存为一个特殊值(如null),并设置较短过期时间(如5分钟)。这样,后续相同请求会命中缓存,避免穿透[^3]。 - **接口限流**:对高频无效查询的接口进行限流,例如使用Redis的计数器或第三方工具(如Sentinel),限制每秒请求数,防止恶意攻击[^1]。 例如,在代码中实现缓存空值: ```python import redis r = redis.Redis(host='localhost', port=6379, db=0) def get_data(key): data = r.get(key) if data is None: # 查询数据库 db_data = query_database(key) if db_data is None: # 缓存空值,过期时间300秒 r.setex(key, 300, "NULL") return None else: r.setex(key, 3600, db_data) # 正常缓存 return db_data elif data == "NULL": return None # 处理空值缓存 else: return data ``` #### 2. **缓存雪崩的解决方案** **问题定义**:缓存雪崩是指大量缓存数据在同一时间失效(如设置相同过期时间),导致所有请求瞬间涌向数据库,造成数据库过载[^2]。 **解决方案**: - **随机过期时间**:为缓存key设置随机的过期时间(如基础时间+随机偏移量)。例如,正常缓存过期时间为3600秒,可添加随机数(±600秒),避免批量失效[^2]。 - **热点数据续期**:实时监控key的访问频率(如使用Redis的监控工具),对热点数据自动续期(延长过期时间),确保其永不过期或接近永不过期[^1]。 - **分级缓存架构**:采用本地缓存(如Caffeine)+ Redis集群的组合。本地缓存处理高频请求,Redis作为二级缓存;当Redis失效时,本地缓存能缓冲请求,减少数据库压力[^1]。 - **熔断降级**:集成熔断工具(如Hystrix或Sentinel),在数据库压力过大时自动触发降级策略(如返回默认值或错误页面),保护数据库[^1]。 例如,设置随机过期时间: ```python import random import redis r = redis.Redis(host='localhost', port=6379, db=0) def set_cache(key, value, base_ttl=3600): random_offset = random.randint(-600, 600) # 随机偏移±10分钟 ttl = base_ttl + random_offset r.setex(key, ttl, value) ``` #### 3. **组合方案建议** 为了全面防护,推荐结合多个策略: - **异步更新缓存**:使用消息队列(如Kafka)异步重建缓存。当缓存失效时,不直接查询数据库,而是发送消息到队列,由后台任务处理,避免并发冲击[^1]。 - **监控自动续期**:部署监控系统,实时识别热点数据和失效风险,自动调整过期时间[^1]。 - **数据库保护**:在应用层添加限流和熔断,确保数据库在高负载时不被击穿[^4]。 总结:缓存穿透的核心是过滤无效查询,而缓存雪崩的关键是分散失效时间。通过布隆过滤器、随机过期时间和分级缓存等方案,能有效降低风险。实际部署中,建议结合业务场景测试优化[^1][^2][^3]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值