聊聊缓存相关知识

原创已于 2022-02-28 22:57:15 修改 · 1.3w 阅读

CC 4.0 BY-SA版权

文章标签：

于 2022-02-28 22:43:47 首次发布

17 篇文章

订阅专栏

5 篇文章

订阅专栏

本文详细探讨了缓存中的三大问题——缓存穿透、缓存击穿和缓存雪崩，解释了它们的成因、示例以及应对策略，包括布隆过滤器的应用、互斥锁、热点数据处理和缓存预热、更新与降级等方法。

缓存原理

在这里插入图片描述

缓存穿透：指用户查询数据，在数据库没有，自然在缓存中也不会有。这样就导致用户查询的时候，在缓存中找不到，每次都要去数据库再查询一遍，然后返回空（相当于进行了两次无用的查询）。这样请求就绕过缓存直接查数据库，这也是经常提的缓存命中率问题。

解决方案

缓存空值/缺省值
如果一个查询返回的数据为空（不管是数据不存在，还是系统故障），我们仍然把这个空结果进行缓存，但它的过期时间会很短，最长不超过五分钟。通过这个直接设置的默认值存放到缓存，这样第二次到缓冲中获取就有值了，而不会继续访问数据库。
布隆过滤器
快速判断数据是否存在，避免从数据库中查询数据是否存在，减轻数据库压力。
将所有可能存在的数据哈希到一个足够大的bitmap中，一个一定不存在的数据会被这个bitmap拦截掉，从而避免了对底层存储系统的查询压力。

布隆过滤器
布隆过滤器（Bloom Filter）是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。布隆过滤器可以用于检索一个元素是否在一个集合中。

布隆过滤器原理
布隆过滤器本质上是一个初始值都为 0 的二进制数组和 N 个哈希函数组成。

当我们想标记某个数据存在时（例如，数据x已被写入数据库），布隆过滤器会通过三个操作完成标记：

具体了解布隆过滤器可参考文章：谈谈布隆过滤器

缓存击穿：缓存中没有数据（一般是缓存时间到期），导致并发请求同时先去取缓存数据，没取到数据，所以又同时去数据库取数据，引起数据库压力瞬间增大，造成过大压力。

缓存击穿一般针对的是后一个Key。当缓存在某个时间点过期的时候，恰好在这个时间点对这个Key有大量的并发请求过来，这些请求发现缓存过期一般都会从后端DB加载数据并回设到缓存，这个时候大并发的请求可能会瞬间把后端DB压垮。

解决方案

使用互斥锁
单机可以使用synchronized、lock，分布式可以使用lua脚本。
在并发的多个请求中，只有第一个请求线程能拿到锁并执行数据库查询操作，其他的线程拿不到锁就阻塞等着，等到第一个线程将数据写入缓存后，直接走缓存。
设置热点数据永不过期
缓存不设置失效时间，有更新的话，需要更新缓存。

缓存雪崩：原有缓存失效，新缓存未到期间所有原本应该访问缓存的请求都去查询数据库了，而对数据库CPU和内存造成巨大压力，严重的会造成数据库宕机。从而形成一系列连锁反应，造成整个系统崩溃。

缓存击穿指并发查同一条数据；缓存雪崩是不同数据都过期了，很多数据都查不到从而查数据库。

解决方案

缓存问题	针对数据	描述
缓存穿透	某个数据	某个数据缓存中没有，该数据的并发请求每次都要去数据库查
缓存击穿	某个数据	某个数据刚好过期，该数据的并发请求全都去数据库查
缓存雪崩	不同数据	不同数据都刚好过期，并发请求全都去数据库查