MYSQL MVCC 实现机制

本文介绍了SQL事务的四种隔离级别及其应用场景,并深入探讨了多版本并发控制(MVCC)机制,通过具体示例展示了MVCC如何在InnoDB存储引擎中实现并发控制。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  SQL标准定义了4类隔离级别,包括了一些具体规则,用来限定事务内外的哪些改变是可见的,哪些是不可见的。低级别的隔离级一般支持更高的并发处理,并拥有更低的系统开销。
Read Uncommitted(读取未提交内容)

       在该隔离级别,所有事务都可以看到其他未提交事务的执行结果。本隔离级别很少用于实际应用,因为它的性能也不比其他级别好多少。读取未提交的数据,也被称之为脏读(Dirty Read)。
Read Committed(读取提交内容)

       这是大多数数据库系统的默认隔离级别(但不是MySQL默认的)。它满足了隔离的简单定义:一个事务只能看见已经提交事务所做的改变。这种隔离级别 也支持所谓的不可重复读(Nonrepeatable Read),因为同一事务的其他实例在该实例处理其间可能会有新的commit,所以同一select可能返回不同结果。
Repeatable Read(可重读)

       这是MySQL的默认事务隔离级别,它确保同一事务的多个实例在并发读取数据时,会看到同样的数据行。不过理论上,这会导致另一个棘手的问题:幻读 (Phantom Read)。简单的说,幻读指当用户读取某一范围的数据行时,另一个事务又在该范围内插入了新行,当用户再读取该范围的数据行时,会发现有新的“幻影” 行。InnoDB和Falcon存储引擎通过多版本并发控制(MVCC,Multiversion Concurrency Control)机制解决了该问题。

Serializable(可串行化) 
       这是最高的隔离级别,它通过强制事务排序,使之不可能相互冲突,从而解决幻读问题。简言之,它是在每个读的数据行上加上共享锁。在这个级别,可能导致大量的超时现象和锁竞争。

         这四种隔离级别采取不同的锁类型来实现,若读取的是同一个数据的话,就容易发生问题。例如:

         脏读(Drity Read):某个事务已更新一份数据,另一个事务在此时读取了同一份数据,由于某些原因,前一个RollBack了操作,则后一个事务所读取的数据就会是不正确的。

         不可重复读(Non-repeatable read):在一个事务的两次查询之中数据不一致,这可能是两次查询过程中间插入了一个事务更新的原有的数据。

         幻读(Phantom Read):在一个事务的两次查询中数据笔数不一致,例如有一个事务查询了几列(Row)数据,而另一个事务却在此时插入了新的几列数据,先前的事务在接下来的查询中,就会发现有几列数据是它先前所没有的。




1.1 什么是MVCC

MVCC是一种多版本并发控制机制。

1.2 MVCC是为了解决什么问题?
  • 大多数的MYSQL事务型存储引擎,如,InnoDB,Falcon以及PBXT都不使用一种简单的行锁机制.事实上,他们都和MVCC–多版本并发控制来一起使用.
  • 大家都应该知道,锁机制可以控制并发操作,但是其系统开销较大,而MVCC可以在大多数情况下代替行级锁,使用MVCC,能降低其系统开销.
1.3 MVCC实现

MVCC是通过保存数据在某个时间点的快照来实现的. 不同存储引擎的MVCC. 不同存储引擎的MVCC实现是不同的,典型的有乐观并发控制和悲观并发控制.

2.MVCC 具体实现分析

下面,我们通过InnoDB的MVCC实现来分析MVCC使怎样进行并发控制的. 
InnoDB的MVCC,是通过在每行记录后面保存两个隐藏的列来实现的,这两个列,分别保存了这个行的创建时间,一个保存的是行的删除时间。这里存储的并不是实际的时间值,而是系统版本号(可以理解为事务的ID),没开始一个新的事务,系统版本号就会自动递增,事务开始时刻的系统版本号会作为事务的ID.下面看一下在REPEATABLE READ隔离级别下,MVCC具体是如何操作的.

2.1简单的小例子

create table yang( 
id int primary key auto_increment, 
name varchar(20));

假设系统的版本号从1开始.

INSERT

InnoDB为新插入的每一行保存当前系统版本号作为版本号. 
第一个事务ID为1;

start transaction;
insert into yang values(NULL,'yang') ;
insert into yang values(NULL,'long');
insert into yang values(NULL,'fei');
commit;
  • 1
  • 2
  • 3
  • 4
  • 5

对应在数据中的表如下(后面两列是隐藏列,我们通过查询语句并看不到)

id name 创建时间(事务ID) 删除时间(事务ID)
1 yang 1 undefined
2 long 1 undefined
3 fei 1 undefined
SELECT

InnoDB会根据以下两个条件检查每行记录: 
a.InnoDB只会查找版本早于当前事务版本的数据行(也就是,行的系统版本号小于或等于事务的系统版本号),这样可以确保事务读取的行,要么是在事务开始前已经存在的,要么是事务自身插入或者修改过的. 
b.行的删除版本要么未定义,要么大于当前事务版本号,这可以确保事务读取到的行,在事务开始之前未被删除. 
只有a,b同时满足的记录,才能返回作为查询结果.

DELETE

InnoDB会为删除的每一行保存当前系统的版本号(事务的ID)作为删除标识. 
看下面的具体例子分析: 
第二个事务,ID为2;

start transaction;
select * from yang;  //(1)
select * from yang;  //(2)
commit; 
  • 1
  • 2
  • 3
  • 4
假设1

假设在执行这个事务ID为2的过程中,刚执行到(1),这时,有另一个事务ID为3往这个表里插入了一条数据; 
第三个事务ID为3;

start transaction;
insert into yang values(NULL,'tian');
commit;
  • 1
  • 2
  • 3

这时表中的数据如下:

id name 创建时间(事务ID) 删除时间(事务ID)
1 yang 1 undefined
2 long 1 undefined
3 fei 1 undefined
4 tian 3 undefined

然后接着执行事务2中的(2),由于id=4的数据的创建时间(事务ID为3),执行当前事务的ID为2,而InnoDB只会查找事务ID小于等于当前事务ID的数据行,所以id=4的数据行并不会在执行事务2中的(2)被检索出来,在事务2中的两条select 语句检索出来的数据都只会下表:

id name 创建时间(事务ID) 删除时间(事务ID)
1 yang 1 undefined
2 long 1 undefined
3 fei 1 undefined
假设2

假设在执行这个事务ID为2的过程中,刚执行到(1),假设事务执行完事务3后,接着又执行了事务4; 
第四个事务:

start   transaction;  
delete from yang where id=1;
commit;  
  • 1
  • 2
  • 3

此时数据库中的表如下:

id name 创建时间(事务ID) 删除时间(事务ID)
1 yang 1 4
2 long 1 undefined
3 fei 1 undefined
4 tian 3 undefined

接着执行事务ID为2的事务(2),根据SELECT 检索条件可以知道,它会检索创建时间(创建事务的ID)小于当前事务ID的行和删除时间(删除事务的ID)大于当前事务的行,而id=4的行上面已经说过,而id=1的行由于删除时间(删除事务的ID)大于当前事务的ID,所以事务2的(2)select * from yang也会把id=1的数据检索出来.所以,事务2中的两条select 语句检索出来的数据都如下:

id name 创建时间(事务ID) 删除时间(事务ID)
1 yang 1 4
2 long 1 undefined
3 fei 1 undefined
UPDATE

InnoDB执行UPDATE,实际上是新插入了一行记录,并保存其创建时间为当前事务的ID,同时保存当前事务ID到要UPDATE的行的删除时间.

假设3

假设在执行完事务2的(1)后又执行,其它用户执行了事务3,4,这时,又有一个用户对这张表执行了UPDATE操作: 
第5个事务:

start  transaction;
update yang set name='Long' where id=2;
commit;
  • 1
  • 2
  • 3

根据update的更新原则:会生成新的一行,并在原来要修改的列的删除时间列上添加本事务ID,得到表如下:

id name 创建时间(事务ID) 删除时间(事务ID)
1 yang 1 4
2 long 1 5
3 fei 1 undefined
4 tian 3 undefined
2 Long 5 undefined

继续执行事务2的(2),根据select 语句的检索条件,得到下表:

id name 创建时间(事务ID) 删除时间(事务ID)
1 yang 1 4
2 long 1 5
3 fei 1 undefined

还是和事务2中(1)select 得到相同的结果.



### MySQLMVCC实现机制与工作机制 #### 1. **MVCC 定义** MVCC 是 Multi-Version Concurrency Control(多版本并发控制)的缩写。它是一种用于管理数据库并发访问的技术,在不牺牲一致性的前提下提升系统的性能[^1]。 #### 2. **MVCC 实现的核心概念** 在 InnoDB 存储引擎中,MVCC 主要依赖以下几个核心概念: - **隐藏字段** 每一行记录都包含了两个额外的隐藏列:`DB_TRX_ID` 和 `DB_ROLL_PTR`。其中: - `DB_TRX_ID` 表示插入或更新该行的最后一个事务的 ID。 - `DB_ROLL_PTR` 是一个指针,指向该行之前的版本所在的回滚段(undo log)。通过这个指针可以追溯历史版本的数据[^3]。 - **Undo Log** Undo 日志用来保存旧版本的数据副本。当某条记录被修改时,其原始版本会被存储到 undo log 中,而新版本则会覆盖原位置上的数据。这样即使其他事务正在读取这条记录的历史版本,也不会受到影响[^4]。 #### 3. **MVCC 工作机制** ##### (1)读操作 根据隔离级别的不同,MVCC 对读操作的支持也有差异: - **快照读(Snapshot Read)** 快照读不会加锁,而是基于一致性视图(Consistent View),即只查看那些满足条件且属于当前事务可见范围内的记录版本。具体判断逻辑如下: - 记录未被删除; - 插入该记录的事务已经提交; - 更新/删除该记录的事务要么尚未开始,要么已结束并提交[^2]。 - **当前读(Current Read)** 当前读会对所涉及的行加锁以防止幻读现象发生。例如 SELECT ... FOR UPDATE 或者 INSERT/UPDATE/DELETE 等语句都会触发当前读行为[^3]。 ##### (2)写操作 对于写操作而言,无论是新增还是更改现有数据项,都需要遵循一定的流程来维护多版本特性: - 新增一条记录时,直接将其附加至表空间末尾,并设置相应的 DB_TRX_ID 值表示由哪个事务创建了此条目; - 修改已有记录时,则先复制一份原有状态存放到 Undo Log 后再做实际改动,同时调整目标行中的 DB_TRX_ID 字段反映最新的变更情况; - 删除某个对象实例同样如此——并非真正意义上物理销毁之,而是标记为“已被移除”,并通过保留足够的上下文信息使得未来可能需要用到这些资料重建过去的状况成为现实可能性之一[^4]。 ```sql -- 示例代码展示如何利用 MVCC 进行查询 SELECT * FROM table_name WHERE condition; -- 上述 SQL 默认执行的是快照读 SELECT * FROM table_name WHERE condition LOCK IN SHARE MODE; -- 加上锁定选项后变为当前读形式 ``` #### 4. **MVCC 在不同隔离级别下的表现** | 隔离级别 | RC 下的行为 | RR 下的行为 | |-------------------|-----------------------------------------------------------------------------------------------|---------------------------------------------------------------------------------------------| | READ UNCOMMITTED | 不适用 | 不适用 | | READ COMMITTED | 每次 select 查询都会生成新的快照,看到最新提交的数据 | 只能看到第一次建立的一致性视图 | | REPEATABLE READ | 使用 MVCC 提供稳定的结果集 | 使用 MVCC 并结合间隙锁避免幻读 | | SERIALIZABLE | 所有读请求均转化为显式的加锁操作 | 类似于串行化处理 | --- 相关问题
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值