mysql读写分离，以及保证保持数据一致性实现方案

最新推荐文章于 2025-03-31 12:42:34 发布

JeekMrc

最新推荐文章于 2025-03-31 12:42:34 发布

阅读量4.7k

点赞数 6

分类专栏： web开发文章标签：数据库 mysql

原文链接：https://blog.youkuaiyun.com/qq_16799391/article/details/107151224

版权

web开发专栏收录该内容

5 篇文章

订阅专栏

首先，说一下读写分离实现原理：
主数据库负责写入操作，从（子）数据库负责读取操作；

然后读写分离的核心是主从同步，也就是主数据库与从数据库的实时数据同步方案。

1、什么是mysql主从同步？

当master(主)库的数据发生变化的时候，变化会实时的同步到slave(从)库。

2、主从同步有什么好处？

水平扩展数据库的负载能力。
容错，高可用。Failover(失败切换)/High Availability
数据备份。
3、主从同步的原理是什么？

首先我们来了解master-slave的体系结构。

如下图：
在这里插入图片描述

不管是delete、update、insert，还是创建函数、存储过程，所有的操作都在master上。当master有操作的时候,slave会快速的接收到这些操作，从而做同步。

但是，这个机制是怎么实现的呢？

在master机器上，主从同步事件会被写到特殊的log文件中(binary-log);在slave机器上，slave读取主从同步事件，并根据读取的事件变化，在slave库上做相应的更改。

如此，就实现了主从同步了！

下面我们来详细的了解。

3.1主从同步事件有哪些

上面说到：

在master机器上，主从同步事件会被写到特殊的log文件中(binary-log);

主从同步事件有3种形式:statement、row、mixed。

statement：会将对数据库操作的sql语句写入到binlog中。
row：会将每一条数据的变化写入到binlog中。
mixed：statement与row的混合。Mysql决定什么时候写statement格式的，什么时候写row格式的binlog。
3.2在master机器上的操作

当master上的数据发生改变的时候，该事件(insert、update、delete)变化会按照顺序写入到binlog中。

binlog dump线程

当slave连接到master的时候，master机器会为slave开启binlog dump线程。当master 的 binlog发生变化的时候，binlog dump线程会通知slave，并将相应的binlog内容发送给slave。

3.3在slave机器上的操作

当主从同步开启的时候，slave上会创建2个线程。

I/O线程。该线程连接到master机器，master机器上的binlog dump线程会将binlog的内容发送给该I/O线程。该I/O线程接收到binlog内容后，再将内容写入到本地的relay log。
SQL线程。该线程读取I/O线程写入的relay log。并且根据relay log的内容对slave数据库做相应的操作。
3.4如何在master、slave上查看上述的线程？

使用SHOW PROCESSLIST命令可以查看。

如图，在master机器上查看binlog dump线程。

在这里插入图片描述

如图，在slave机器上查看I/O、SQL线程。
在这里插入图片描述

4、讲了这么多，一图以蔽之
在这里插入图片描述

数据库读写分离主要解决高并发时，提高系统的吞吐量。因为大部分场景下都是读多写少。下图是数据库读写分离模型。
在这里插入图片描述

每次请求打到这个系统后：

读请求，直接读从库
写请求，先写入主库，然后主库将数据同步到其他从库
在高并发或者网络状况不理想时，写完数据后，主库还没来得及将数据同步到从库，其他读请求去读从库，发现从库中的数据仍然是旧数据。这就是读写分离数据库数据不一致的根本原因。
下面给出两种方案去解决这个问题：

缓存标记法
在这里插入图片描述

上图流程：
1）A发起写请求，更新了主库，再在缓存中设置一个标记，代表此数据已经更新，标记格式（用户ID+业务ID+其他业务维度）
2）设置此标记，要加上过期时间，可以为预估的主库和从库同步延迟的时间
3）B发起读请求的时候，先判断此请求的业务在缓存中有没有更新标记
4）如果存在标记，走主库；如果没有走从库。

这个方案就有效了解决了数据不一致的问题。
但这个方案会有个严重的问题，也就是每次的读请求都要到缓存中去判断是否存在缓存标记，如果是单机部署用的是jvm缓存，对性能还好；但如果是集群部署缓存肯定用redis，每次读都要和redis进行交互，这样肯定会影响系统吞吐量。

那么解决这个问题可以用下面这个方案

本地缓存标记
在这里插入图片描述