缓存模式,把数据从源数据加载到缓存中,可以改善服务的性能,同时尽量确保缓存与源数据的一致性。
背景
为了提高服务性能,我们通常用缓存来保存一些热点数据。但是,数据一致性是个挑战,要保证缓存与源数据完全一致是不现实的,因此服务需要一个策略来保证缓存中的数据尽可能与源数据保持一致,同时正确处理缓存中过期的数据。
解决方案
现在有很多成熟的缓存解决方案,他们提供直读(read-through)、直写(write-through) / 回写(write-behind)功能。使用这些缓存方案,服务可以先从缓存中获取数据,如果缓存中不存在,再去源数据中获取数据,同时添加到缓存中。任何对缓存数据的修改也会同步修改到源数据中。
服务如果不采取第三方缓存方案,也可以自己实现直读、直写,
下图是采取缓存方案的数据读取流程,
当涉及到数据更新时,服务可以模仿直写方案,
- 更新源数据
- 把缓存中对应的数据置为无效
当服务再次去读这个数据时,更新后的数据就会被加载到缓存中,这个就是 Cache-Aside Pattern。
需要注意
在实现缓存方案时,有几点需要注意,
- 缓存数据的生命周期。许多缓存都有数据过期策略来保证数据在一段时间没有被访问后,会从缓存中删除掉。因此在实现缓存方案时,要选取一个合适的过期时间。如果时间过短,会导致服务频繁从源数据获取数据;如果时间过长,缓存中的数据和可能会变成脏数据。
- 数据淘汰。缓存的容量有限(一般缓存的存储成本较高,容量不会很大),如果容量不足时,他们会逐出一部分数据。大部分缓存系统会采用LRU策略来决定逐出哪些数据。当然LRU不一定完全合适,服务可以根据数据本身的特点自定不同的淘汰策略,例如一部分数据查询成本很高,那么它最好一直保存在cache中,而不是被淘汰。
- 缓存预热。缓存预热表示在缓存启动的同时,加载数据到缓存。
- 数据一致性。
- 本地缓存(内存)。