四种策略让 MySQL 和 Redis 数据保持一致

目录

一. 前言

二. 缓存不一致是如何产生的

三. 缓存更新的几种设计

3.1. 先删除缓存,再更新数据库

3.2. 先更新数据库,再让缓存失效

3.3. 只更新缓存,由缓存自己同步更新数据库(Read/Write Through Pattern)

3.4. 只更新缓存,由缓存自己异步更新数据库(Write Behind Cache Pattern)

四. 总结


一. 前言

    先阐明一下 MySQL 和 Redis 的关系:MySQL 是关系型数据库,用来持久化数据,一定程度上保证数据的可靠性;Redis 是 K-V 缓存,用来提升数据访问的性能。

    关于如何保证 MySQL 和 Redis 中的数据一致(即缓存一致性问题),这是一个非常经典的问题。使用过缓存的人都应该知道,在实际应用场景中,要想实时保证缓存和数据库中的数据一样,很难做到。基本上都是尽可能让他们的数据在绝大部分时间内保持一致,并保证最终是一致的。

二. 缓存不一致是如何产生的

    如果数据一直没有变更,那么就不会出现缓存不一致的问题。

    通常缓存不一致是发生在数据有变更的时候。因为每次数据变更你需要同时操作数据库和缓存,而他们又属于不同的系统,无法做到同时操作成功或失败,总会有一个时间差。在并发读写的时候可能就会出现缓存不一致的问题(理论上通过分布式事务可以保证这一点,不过实际上基本上很少有人这么做)。

    虽然没办法在数据有变更时,保证缓存和数据库强一致,但对缓存的更新还是有一定设计方法的,遵循这些设计方法,能够让这个不一致的影响时间和影响范围最小化。

三. 缓存更新的几种设计

缓存更新的设计方法大概有以下四种:

  1. 先删除缓存,再更新数据库(这种方法在并发下最容易出现长时间的脏数据,不可取)。
  2. 先更新数据库,删除缓存(Cache Aside Pattern)。
  3. 只更新缓存,由缓存自己同步更新数据库(Read/Write Through Pattern)。
  4. 只更新缓存,由缓存自己异步更新数据库(Write Behind Cache Pattern)。

接下来详细介绍一些这四种设计方法。

3.1. 先删除缓存,再更新数据库

这种方法在并发读写的情况下容易出现缓存不一致的问题。

如上图所示,其可能的执行流程顺序为:

  1. 客户端1 触发更新数据 A 的逻辑;
  2. 客户端2 触发查询数据 A 的逻辑;
  3. 客户端1 删除缓存中数据 A;
  4. 客户端2 查询缓存中数据 A,未命中;
  5. 客户端2 从数据库查询数据 A,并更新到缓存中;
  6. 客户端1 更新数据库中数据 A。

可见,最后缓存中的数据 A 跟数据库中的数据 A 是不一致的,缓存中的数据 A 是旧的脏数据。

因此一般不建议使用这种方式

3.2. 先更新数据库,再让缓存失效

这种方法在并发读写的情况下,也可能会出现短暂缓存不一致的问题。

如上图所示,其可能执行的流程顺序为:

  1. 客户端1 触发更新数据 A 的逻辑;
  2. 客户端2 触发查询数据 A 的逻辑;
  3. 客户端3 触发查询数据 A 的逻辑;
  4. 客户端1 更新数据库中数据 A;
  5. 客户端2 查询缓存中数据 A,命中返回(旧数据);
  6. 客户端1 让缓存中数据 A 失效;
  7. 客户端3 查询缓存中数据 A,未命中;
  8. 客户端3 查询数据库中数据 A,并更新到缓存中。

    可见,最后缓存中的数据 A 和数据库中的数据 A 是一致的,理论上可能会出现一小段时间数据不一致,不过这种概率也比较低,大部分的业务也不会有太大的问题。

3.3. 只更新缓存,由缓存自己同步更新数据库(Read/Write Through Pattern)

    这种方法相当于是业务只更新缓存,再由缓存去同步更新数据库。一个 Write Through 的例子如下:

如上图所示,其可能执行的流程顺序为:

  1. 客户端1 触发更新数据 A 的逻辑;
  2. 客户端2 触发查询数据 A 的逻辑;
  3. 客户端1 更新缓存中数据 A,缓存同步更新数据库中数据 A,再返回结果;
  4. 客户端2 查询缓存中数据 A,命中返回。

    Read Through 和 Write Through 的流程类似,只是在客户端查询数据 A 时,如果缓存中数据 A失效了(过期或被驱逐淘汰),则缓存会同步去数据库中查询数据 A,并缓存起来,再返回给客户端。

    这种方式缓存不一致的概率极低,只不过需要对缓存进行专门的改造。

3.4. 只更新缓存,由缓存自己异步更新数据库(Write Behind Cache Pattern)

这种方式性相当于是业务只操作更新缓存,再由缓存异步去更新数据库,例如:

如上图所示,其可能的执行流程顺序为:

  1. 客户端1 触发更新数据 A 的逻辑;
  2. 客户端2 触发查询数据 A 的逻辑;
  3. 客户端1 更新缓存中的数据 A,返回;
  4. 客户端2 查询缓存中的数据 A,命中返回;
  5. 缓存异步更新数据 A 到数据库中。

    这种方式的优势是读写的性能都非常好,基本上只要操作完内存后就返回给客户端了,但是其是非强一致性,存在丢失数据的情况。

    如果在缓存异步将数据更新到数据库中时,缓存服务挂了,此时未更新到数据库中的数据就丢失了。

四. 总结

    上面讲到的几种缓存更新的设计方式,都是前人总结出来的经验,这些方式或多或少都有一些弊端,并不完美,实际上也很难有完美的设计。大家在做系统设计的时候,也不要去追求完美,要有一些取舍,找到一种最适合自己业务场景的方式就行。

### 解决 MySQL Redis 数据一致性问题 #### 延迟双删策略概述 为了确保 MySQL Redis数据一致性,在分布式环境中采用延迟双删策略是一种常见做法。该方法的核心是在更新数据库的同时也更新缓存,但在某些极端情况下可能会导致两者之间的短暂不一致[^1]。 #### 实现细节 - **初次删除操作**:当接收到对某个键值的更新请求时,先立即从 Redis 中移除对应的缓存条目。 ```python redis.delete(key) ``` - **执行数据库写入**:随后向 MySQL 发起实际的数据变更指令。 ```sql UPDATE table_name SET column=value WHERE condition; ``` - **二次确认机制**:设定一定时间间隔后的再次验证过程,即所谓的“延迟”。如果在这段时间内发生了异常情况(比如网络波动),则重新尝试清除残留于 Redis 内部可能存在的旧版本记录。 这一阶段可以通过定时任务来完成,也可以借助消息队列等异步工具实现更灵活的任务调度。 #### 处理延迟双删的具体措施 针对可能出现的问题,可以采取如下几种优化手段: - 使用可靠的消息中间件如 Kafka 或 RabbitMQ 来传递事件通知给负责清理工作的消费者组件; - 对每次涉及敏感字段变动的操作设置较短的有效期 TTL (Time To Live),从而减少因未及时刷新而造成的误读风险; - 配合 Canal 等开源项目监听 Binlog 日志变化并自动触发相应的维护动作,无需改动现有应用程序逻辑结构即可达成目的[^4]。 #### 双写场景的最佳实践建议 对于需要频繁交互的应用层面上,则应遵循以下原则以提高整体系统的稳定性可靠性: - 尽量缩小事务边界范围内的并发度差异,防止因为锁竞争等原因引发不必要的性能瓶颈; - 明确区分不同类型资源间的依赖关系链路,避免形成循环等待局面进而造成死锁现象的发生; - 定期审查线上环境配置参数合理性以及监控指标健康状况,提前预防潜在隐患爆发的可能性。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

流华追梦

你的鼓励将是我创作最大的动力。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值