缓存与数据库双写一致性问题
你只要用缓存,就可能会涉及到缓存与数据库双存储双写,你只要是双写,就一定会有数据一致性的问题,那么你如何解决一致性问题?
先更新数据库,再更新缓存(×)
- 按照业务流程,希望更新数据后,那么对应的缓存数据应该是最新的;但是实际上并发情况会造成,缓存的数据并不是最新的;
- 图解:
- 线程1更新数据库,然后去更新缓存;此时线程2进来了,并且1还没有更新好缓存;
- 线程2同样也更新了数据库(在1之后,按道理他的数据才是最新的),并且在1之前更新好了缓存;
- 此时1才完成,导致redis数据是1,数据库是2的;
先删除缓存,再更新数据库(×)
- 并发情况会导致脏数据,导致数据库和缓存的数据不一致;
- 图解:
- 一个线程删除缓存,然后去更新数据库,还没有更新完前,
- 此时线程2去查redis,发现被删了,就去查数据库,然后将数据同步到缓存,
- 直到线程1 的更新数据库操作才刚刚完成;那么在线程1没有更新完数据库并同步到redis前,所有进来的线程访问的redis都是旧数据。
- 那么在线程1没有更新完数据库并同步到redis前,所有进来的线程访问的redis都是旧数据。
先更新数据库,再删除缓存(√)
数据一致性总结:
-
缓存是通过牺牲数据一致性来提高性能的,一定要结合业务场景来使用;
-
缓存一定要设置过期时间;而且要合理设置:
- 太短:请求会比较多落在数据库上面;
- 太长:缓存不能及时更新,太多的脏数据使得系统长时间处于延迟状态,并未如果没有人访问,会内存浪费;

在分布式系统中,缓存与数据库双写一致性是一大挑战。常见的问题包括先更新数据库再更新缓存导致的并发问题,以及先删除缓存再更新数据库造成的脏数据问题。解决策略是采用'先更新数据库,再删除缓存'的方式,配合缓存过期时间和业务场景,确保数据最终一致性。同时,合理设置缓存过期时间以平衡性能与数据新鲜度。
410

被折叠的 条评论
为什么被折叠?



