缓存穿透、缓存击穿、缓存雪崩
1 缓存穿透
(简单记忆:查数据库中没有的数据)
1.1 具体过程
用户访问浏览器,浏览器访问web服务器,那么web服务器每次肯定都先查缓存(Redis),缓存中有数据直接返回,没有数据就去查数据库,返回,同时将数据放在缓存中。现在有大量的访问,它每次操作先去查缓存,因为Redis缓存中大部分数据都不存在,所以所有数据都去查数据库,而数据库中一直访问不到数据,因为这些值都是不存在的,因此一直无法查询到,无法放到缓存中,造成数据库压力急剧增加,缓存中命中率急剧降低,数据库中一直产生访问压力,从而导致数据库崩溃。Redis在这个过程中一直平稳的运行,只是没有起到作用,这就叫缓存穿透现象。
1.2 特点
- 应用服务器压力变大了,大量请求过来
- Redis命中率降低,查不到数据了
- 因为缓存中查不到数据,所以Web服务器会一直去查询数据库,造成数据库压力急剧增加,导致数据库崩溃了
1.3 原因
-
Redis查询不到数据了,比如Redis缓存不进数据了
-
出现很多非正常url访问。例如,在百度百科中随意输入一个值,这个url是不存在的。网站可能遭受到了恶意攻击或者黑客攻击。
1.4 解决方案
(1)对空值缓存,设置较短的过期时间(简单的临时应急方案):例如查询1200,如果查询不到结果,返回null,那么我们仍然把这个空结果缓存到Redis中,但是将空结果的过期时间设置的短一点,比如五分钟
(2)使用bitmaps设置可访问的白名单:使用bitmaps类型定义一个可以访问的名单,名单id作为bitmaps的偏移量,每次访问时,使用访问id和bitmaps里面的id进行比较,如果访问id不在bitmaps里面,进行拦截,不允许访问。
(3)采用布隆过滤器:布隆过滤器(Bloom Filter)是1970年由布隆提出的,可以用于检索一个元素是否在一个集合中。它的底层实现是跟bitmaps一样的,是将所有可能存在的数据哈希到一个足够大的bitmaps中,一个一定不存在的数据会被这个bitmaps拦截掉,从而避免了对数据库的查询压力。
它的优点是对bitmaps做了一些优化,让它效率更高,缺点是有时识别不是很准确,命中率可能不够高。
(4)进行实时监控:当发现Redis的命中率开始急速降低,需要排查访问对象和访问的数据,和运维人员配合,可以设置黑名单限制服务。假如有一个用户,一直在访问我们网站,他的访问一直都是一些无效的访问,导致Redis命中率降低,那么就将他列入黑名单,下次再来就不给访问。
各种方法的最终目的是将攻击者的访问拦到服务器外边,不进入服务器中,减少服务器压力
2 缓存击穿
2.1 现象/原因
redis某个key过期了(这个key是热门访问的key),这时有大量的访问都使用这个key,不断访问数据库,造成数据库压力瞬间增大,这个现象称为缓存击穿
2.2 特点
-
数据库访问压力瞬间增大
-
redis没有出现大量的key过期。(redis中的key是可以过期的,过期了就访问不到了,就只能去访问数据库)
-
redis正常运行
2.3 解决方案
- 预先设置热门数据:在redis高峰访问之前,把一些热门数据提前存入到redis里面,加大这些热门数据key的时长
- 实时调整:现场监控哪些数据热门,实时调整key的过期时长
- 使用锁:
- 查询Redis,返回结果为空的时候,不是立即去访问数据库
- 而是设置一个排它锁
- 如果操作失败,证明有线程在访问数据库,让当前线程睡眠一段时间再次查询
- 如果操作成功,再进行访问数据库的操作,并同步到缓存中,最后删除排它锁
3 缓存雪崩
1. 现象
在极少的时间段,出现大量key集中过期的情况,缓存中的数据就访问不到了,命中率降低,就去访问数据库,导致数据库压力变大,响应变慢,进而导致应用程序的访问变慢,造成服务器崩溃,这就是缓存雪崩现象。
2. 解决方案
(1) 构建多级缓存架构:nginx缓存 + redis缓存 +其他缓存(ehcache/ei’kek/等)
(2) 使用锁或队列:使用加锁或者队列的方式保证不会有大量的线程一次性对数据库进行读写,从而避免缓存失效时大量的并发请求落到数据库上,造成压力过大。效率低,不适用高并发情况。
锁的机制:我操作,别人只能等,我操作了之后,别人再操作。他操作,另外的人也要等。
(3) 设置过期标志更新缓存:设置一个提前量,记录缓存数据是否过期,如果过期,会通知另外的线程去更新key的缓存
(4) 将缓存失效时间分散开:可以在原有的失效时间的基础上增加一个随机值,比如1-5分钟随机一个时间,这样每一个缓存的过期时间的重复率就会降低,就很难引发集体失效的事件
缓存击穿跟缓存雪崩的区别
缓存击穿:没有大量的key过期。而是某个热门key过期,此时刚好有大量的访问使用这个key,导致数据库压力瞬间增大
缓存雪崩:大量key集中过期,造成缓存命中率降低,导致数据库压力增大,服务器崩溃