MySQL 中实现可重复读(RR)的原理--MVCC

本文深入解析MySQL中的MVCC(多版本并发控制)机制,介绍其如何通过Undolog和Read-view实现不同隔离级别的读已提交和可重复读取,并提供具体案例帮助理解。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

MVCC,多版本并发控制(Multi-Version Conncurrency Control)是mysql中基于乐观锁原理实现的隔离级别的方式。用于实现读已提交和可重复读取隔离级别。
对于MVCC,是通过在每行记录后面保存两个隐藏的列来实现的。这两个列,一个保存了行的创建时间(事务ID),一个保存行的删除时间(回滚指针),当然存储的并不是实际的时间值,而是系统版本号(system version number).每开始一个新的事务,系统版本号都会自动递增,事务开始时刻的系统版本号会作为事务的版本号,用来和查询到的每行记录的版本号进行比较。

MVCC的核心就是 Undo log+ Read-view,“MV”就是通过 Undo log来保存数据的历史版本,实现多版本的管理,“CC”是通过 Read-view来实现管理,通过 Read-view原则来决定数据是否显示。同时针对不同的隔离级别, Read view的生成策略不同,也就实现了不同的隔离级别。

简单说一句话就是:undo log + 版本链 + 比较规则

举例:
如下图,事务 T-100 和 T-120 对表中 id = 1 的数据行做 update 操作,事务 T-130 进行 select 操作。

从图中可以看出,即使 T-100 已经提交修改,三次 select 语句的结果都是“lisi”。
整个过程的流程如下图:

下面详细讲讲流程:

当一个事务第一次执行查询sql时,会生成一致性视图 read-view(快照),它由执行查询时所有未提交事务 id 数组(数组中最小的 id 为 min_id)和已创建的最大事务 id(max_id)组成,查询时从 undo log 中最新的一条记录开始跟 read-view 做对比,如果不符合比较规则,就根据回滚指针回滚到上一条记录继续比较,直到得到符合比较条件的查询结果。对于上面的例子,事务T-130 在第一次执行select 语句时,生成了 read-view 快照,此时未提交的事务id是100,已提交的事务id是120,所以 read-view :[100],120

undo log 中记录和 read-view 的比对规则:

  1. 如果当前记录的事务id落在绿色部分(trx_id < min_id),表示这个版本是已提交的事务生成的,可读。
  2. 如果当前记录的事务id落在红色部分(trx_id > max_id),表示这个版本是由将来启动的事务生成的,不可读。
  3. 如果当前记录的事务id落在黄色部分(min_id <= trx_id <= max_id),则分为两种情况:
    • 若当前记录的事务id在未提交事务的数组中,则此条记录不可读;
    • 若当前记录的事务id不在未提交事务的数组中,则此条记录可读。

扩展
1)对于删除的情况
可以认为是update 的特殊情况,会将版本链上最新的数据复制一份,然后将 trx_id 修改成删除操作的 trx_id ,同时在该条记录的头信息(record header)里的(deleted_flag)标记位上写位 true,来表示当前记录已经被删除,在查询时按照上面的规则查到对应的记录,如果deleted_flag 标记为是true,则说明该条记录已被删除,不返回数据。

2)隔离级别 Read Committed 和 Read Repeatable
RC 和 RR 隔离级别都是由 MVCC 实现,区别在于:
RC 隔离级别时,read-view 是每次执行 select 语句时都生成一个;
RR 隔离级别时,read-view 是在第一次执行 select 语句时生成一个,同一事务中后面的所有 select 语句都复用这个 read-view 。

### MVCC可重复隔离级别下的实现机制 多版本并发控制(MVCC,Multi-Version Concurrency Control)是一种用于提高数据库系统并发性能的技术,在MySQL的InnoDB存储引擎中广泛使用。以下是关于MVCC如何支持可重复(Repeatable Read, RR)隔离级别的具体实现原理: #### 1. 版本链与隐藏字段 每一条记录在存储时都有两个额外的隐藏字段:`DB_TRX_ID` 和 `DB_ROLL_PTR`。 - `DB_TRX_ID` 表示最后一次修改该记录的事务ID[^1]。 - `DB_ROLL_PTR` 是一个指针,指向这条记录之前的某个历史版本,这些历史版本会形成一个版本链。 当新版本的数据被写入时,旧版本不会立即删除,而是通过 `DB_ROLL_PTR` 链接起来,从而保留多个时间点上的数据副本[^2]。 #### 2. 一致性视图 在可重复隔离级别下,事务启动时会创建一个一致性视图(Consistent View)。这个视图包含了当前所有活动事务的列表以及已完成事务的最大事务ID。基于此视图,后续所有的查询操作都将看到相同的时间点状态,即使其他事务对同一数据进行了修改并提交。 对于每次查询请求来说,它只会访问那些满足以下条件之一的历史版本: - 记录的 `DB_TRX_ID` 小于等于创建一致视图时的最大已提交事务ID; - 或者如果存在回滚指针,则沿着版本链找到第一个符合条件的老版本。 这种机制确保了同一个事务内的多次SELECT语句能够获得一致的结果集,即实现了所谓的“可重复”。 #### 3. 当前 vs 一致性 需要注意的是,“可重复”仅适用于普通的 SELECT 查询,默认情况下采用了一致性的方式。然而,某些特定场景如 WHERE 子句中的主键查找或者范围扫描加上 FOR UPDATE/LOCK IN SHARE MODE 提示符时,则触发了所谓 的 “当前”。此时不再依赖版本链获取过去时刻的状态,而是直接锁定最新的实际行数据供自己独占使用直至完成整个事务周期结束为止。 ```sql -- 示例代码展示不同类型的取方式 BEGIN; SELECT * FROM table_name; -- 这是一致性 (consistent read),利用MVCC提供稳定快照 SELECT * FROM table_name LOCK IN SHARE MODE; -- 此为当前形式之一 COMMIT; ``` 上述SQL片段展示了两种不同的行为差异之处在于是否有加锁标志附加到标准检索命令后面去改变其默认动作模式从简单的只看快照转变成强制查看最新真实情况并且可能涉及资源争用现象发生几率增大等问题考虑进去设计应用逻辑时候应该格外小心谨慎处理好两者之间的平衡关系才能达到最佳效果表现出来给最终用户呈现满意的服务质量水平上去追求极致体验感受吧! ---
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值