1.缓存穿透
概念
- 应用服务器 压力突然变大
先查缓存,缓存中没有再查数据库, 放在缓存
- 大量请求时 redis查不到数据了 redis缓存命中率减低了
- 导致一直去查数据库,数据库压力太大,导致奔溃
产生原因:
-
服务突然增加,redis查不到数据了 redis缓存命中率减低了
-
出现很多非URL访问(就是请求参数里面的值 本来就是数据库中没有的)*(应该是遭到攻击了)
根本:缓存没起到作用
解决方案
一个一定不存在缓存及查询不到的数据,由于缓存是不命中时被动写的,并且出于容错考虑,如果从存储层查不到数据则不写入缓存,这将导致这个不存在的数据每次请求都要到存储层去查询,失去了缓存的意义。
解决方案:
(1) 对空值缓存如果一个查询返回的数据为空(不管是数据是否不存在),我们仍然把这个空结果(null)进行缓存,设置空结果的过期时间会很短,最长不超过五分钟
(2) 设置可访问的名单(白名单):
使用bitmaps类型(位操作)定义一个可以访问的名单,名单里是对所有可能查询到的参数。名单id作为bitmaps的偏移量,每次访问和bitmap里面的id进行比较,如果访问id不在bitmaps里面,进行拦截,不允许访问。
(3) 采用布隆过滤器:(布隆过滤器(Bloom Filter)是1970年由布隆提出的。它实际上是一个很长的二进制向量(位图)和一系列随机映射函数(哈希函数)。
布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都远远超过一般的算法,缺点是有一定的误识别率和删除困难。)
将所有可能存在的数据哈希到一个足够大的bitmaps中,一个一定不存在的数据会被 这个bitmaps拦截掉,从而避免了对底层存储系统的查询压力。
(4) 进行实时监控当发现Redis的命中率开始急速降低,需要排查访问对象和访问的数据,和运维人员配合,可以设置黑名单限制服务
2.缓存击穿
概念
现象 :
- 数据库访问压力突然增加
- redis里面没有出现过期
- redis平稳运行状态
原因
当某个 key 在过期的瞬间,有大量的请求这个 key 的数据,这种数据是热点数据。由于在缓存过期的瞬间,请求会同时访问到持久化的数据库来查询数据,并且会将数据会写到缓存中,此时就会导致数据库瞬间的压力过大,导致击穿
- redis某个key过期了,这个key有目前有大量的访问 ( 热点key
解决方案
key可能会在某些时间点被超高并发地访问,是一种非常“热点”的数据。这个时候,需要考虑一个问题:缓存被“击穿”的问题。
解决问题:
(1)预先设置热门数据在redis高峰访问之前,把一些热门数据提前存入到redis里面,加大这些热门数据key的时长
(2)实时调整现场监控哪些数据热门,实时调整key的过期时长
(3)使用锁可以解决 但是效率低
(1) 就是在缓存失效的时候(判断拿出来的值为空),不是立即去load db。
(2) 先使用缓存工具的某些带成功操作返回值的操作(比如Redis的SETNX)去set一个mutex key
(3) 当操作返回成功时,再进行load db的操作,并回设缓存,最后删除mutex key;
(4) 当操作返回失败,证明有线程在load db,当前线程睡眠一段时间再重试整个get缓存的方法。
击穿和穿透的区别:
击穿,是一个 key 非常热点,大量的访问都打在这个 key 上面,在 key 失效的瞬间,所有请求打在数据库上,就打出一个洞,击穿了
而穿透是更多的是访问的数据不存在的情况,大量的请求访问的都是不存在的数据
3.缓存雪崩
概念
就是在某一个时间段,缓存集中过期,或者 redis 宕机的情况会出现
key对应的数据存在,但在redis中过期,此时若有大量并发请求过来,这些请求发现缓存过期一般都会从后端DB加载数据并回设到缓存,这个时候大并发的请求可能会瞬间把后端DB压垮。
缓存雪崩与缓存击穿的区别在于这里针对很多key缓存,前者则是某一个key
例如:
在某些热点活动中,会设置某些商品在一个固定的时间内过期,那么在 redis 里面,这个固定的时间点,大量的 key 过期,这就导致在这个时间段 缓存失效了,
且大量的请求数据都打在了持久化数据库上面了,这就很难受,在这种压力波峰下,压力全部打在持久化数据库上,这会造成持久化数据库宕机
造成
解决方案
缓存失效时的雪崩效应对底层系统的冲击非常可怕!
解决方案:
(1) **构建多级缓存架构:**nginx缓存 + redis缓存 +其他缓存(ehcache等)
(2) 使用锁或队列:
用加锁或者队列的方式保证来保证不会有大量的线程对数据库一次性进行读写,从而避免失效时大量的并发请求落到底层存储系统上。不适用高并发情况
(3) 设置过期标志更新缓存:
记录缓存数据是否过期(设置提前量),如果即将过期会触发通知另外的线程在后台去更新实际key的缓存。
(4) 将缓存失效时间分散开:
比如我们可以在原有的失效时间基础上增加一个随机值,比如1-5分钟随机,这样每一个缓存的过期时间的重复率就会降低,就很难引发集体失效的事件。
将 redis 做成高可用的
搭建 redis 集群,异地多活,既然担心 redis 会挂,那么我们就多准备一些 redis ,做成主备,或者异地多活
4.分布式锁
随着业务发展的需要,原单体单机部署的系统被演化成分布式集群系统后,由于分布式系统多线程、多进程并且分布在不同机器上,这将使原单机部署情况下的并发控制锁策略失效,单纯的Java API并不能提供分布式锁的能力。为了解决这个问题就需要一种跨JVM的互斥机制来控制共享资源的访问,这就是分布式锁要解决的问题!
这个锁要对整个集群都有效,而不是针对一个机器
分布式锁主流的实现方案:
-
基于数据库实现分布式锁
-
基于缓存(Redis等)
-
基于Zookeeper
每一种分布式锁解决方案都有各自的优缺点:
-
性能:redis最高
-
可靠性:zookeeper最高
redis实现分布式锁:
setnx 相当于加锁, del 相当于释放 , 在这个过程中 其他的不能setnx 同一个k
出现问题: 如果加锁的程序卡死 或 sleep 导致后面所有程序进不去
解决:给锁加过期时间 自动释放
setnx user 10
expire user 10 (10秒过期)
出现问题:两步操作 在第一步上锁后 突然断电,那就…无法设置过期时间
解决:set user 10 nx ex 12 (12秒过期)
问题:可能会释放其他服务器的锁。
场景1:如果业务逻辑的执行时间是7s。执行流程如下。关键点:7s后会del,但是3s时已经自动释放了,那我7s del的可能是其他人的锁
index1业务逻辑没执行完,3秒后锁被自动释放。
index2获取到锁,执行业务逻辑,3秒后锁被自动释放。
index3获取到锁,执行业务逻辑
index1业务逻辑执行完成,开始调用del释放锁,这时释放的是index3的锁,导致index3的业务只执行1s就被别人释放。
最终等于没锁的情况。
场景2:和场景1差不多
解决:setnx获取锁时,设置一个指定的唯一值(例如:uuid);释放前获取这个值,判断是否自己的锁
锁的value值为一个随机生成的UUID,通过此在释放锁的时候进行判断
加锁的时候 设一个自己的UUID ,最后删的时候 如果是我加的那个锁 我才删 ,否则不用管
问题:删除操作缺乏原子性。
精确到了行
解决:LUA脚本保证删除的原子性 (集群不支持lua??? 所以我们解决分布式问题的redis 不能是集群。貌似也没必要是集群) 保证比较后就去删除,不让自动释放的命令去插队
@GetMapping("testLockLua")
public void testLockLua() {
//1 声明一个uuid ,将做为一个value 放入我们的key所对应的值中
String uuid = UUID.randomUUID().toString();
//2 定义一个锁:lua 脚本可以使用同一把锁,来实现删除!
String skuId = "25"; // 访问skuId 为25号的商品 100008348542
String locKey = "lock:" + skuId; // 锁住的是每个商品的数据
// 3 获取锁 加锁有原子性
Boolean lock = redisTemplate.opsForValue().setIfAbsent(locKey, uuid, 3, TimeUnit.SECONDS);
if (lock) {
// 执行的业务逻辑开始
// 获取缓存中的num 数据
Object value = redisTemplate.opsForValue().get("num");
// 如果是空直接返回
if (StringUtils.isEmpty(value)) {
return;
}
// 不是空 如果说在这出现了异常! 那么delete 就删除失败! 也就是说锁永远存在!
int num = Integer.parseInt(value + "");
// 使num 每次+1 放入缓存
redisTemplate.opsForValue().set("num", String.valueOf(++num));
/*使用lua脚本来释放锁*/
// 定义lua 脚本
String script = "if redis.call('get', KEYS[1]) == ARGV[1] then return redis.call('del', KEYS[1]) else return 0 end";
// 使用redis执行lua执行
DefaultRedisScript<Long> redisScript = new DefaultRedisScript<>();
redisScript.setScriptText(script);
// 设置一下返回值类型 为Long
// 因为删除判断的时候,返回的0,给其封装为数据类型。如果不封装那么默认返回String 类型,
// 那么返回字符串与0 会有发生错误。
redisScript.setResultType(Long.class);
// 第一个要是script 脚本 ,第二个需要判断的key,第三个就是key所对应的值。
redisTemplate.execute(redisScript, Arrays.asList(locKey), uuid);
} else {
// 其他线程等待
try {
// 睡眠
Thread.sleep(1000);
// 睡醒了之后,调用方法。
testLockLua();
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}