本文讨论的前提:
- 不是一个事务,永远无法满足数据库和缓存的强一直性的;
- 文中会列举不一致的逻辑场景;
- 一定是依解决业务问题,和业务达成的共同目标为前提;
前言
只要用到多数据源存储同一份相同的数据,在更新时,都会考虑数据一致性问题。这是常见问题,但是对于分布式系统的CAP 理论,相信很多人都听过,它是指:一个分布式系统最多只能同时满足一致性(Consistency)、可用性(Availability)和分区容错性(Partition tolerance)这三项中的两项。
为什么要理解 CAP 理论?
我能说出很多理由来。如果是在职场上,也许最合适的理由是,当领导给出的任务不靠谱时,我们可以依据 CAP 去否决它。比如,有这么一个任务,给你定了个大目标:
1. 这个系统满足编辑后数据要有实时性可见;
2. 还要系统的可用性,即响应效率高、响应结果合理,不能有bug;
3. 分区容错能力要高故障率99.9999%;
这个目标能完成吗?
本次讨论的数据库和缓存的数据一致性,就是Consistency。
为什么出现数据不一致
我们引入缓存机制,目的是:提高查询效率,这是初衷和前提,在并发场景下,也引入了一个问题,**何时去更新缓存?**在数据更新时,