【MYSQL】事务隔离级别以及InnerDB底层实现(MVCC)

事务隔离级别

读未提交(Read Uncommitted)

允许事务读取其他事务未提交的数据,可能会导致脏读。

读已提交(Read Committed)

一个事务只能看见已经提交的事务所做的更改,可以避免脏读,但可能会遇到不可重复读。

可重复读(Repeatable Read)

在一个事务内,多次读取同一数据的结果是一致的,即使其他事务在这期间对数据进行了修改和提交。此隔离级别可以防止不可重复读,但可能遇到幻读。

串行化(Serializable)

最高隔离级别,通过完全序列化事务来避免所有并发问题,这通常通过锁定事务访问的行来实现,性能开销较大。

在这里插入图片描述

MVCC的具体实现

隐藏字段

InnoDB存储引擎在每行数据的后面添加了三个隐藏字段:

1、DB_TRX_ID(6字节):记录创建或最后一次更新该行的事务ID。

在InnoDB中,每个事务都有一个唯一的事务ID,叫做transaction
id(缩写trx_id),它是在事务开始时候向InnoDB的事务系统申请的,并且按照申请顺序严格递增。在这里DB_TRX_ID就表示最近一次对该行数据作修改(insert或update)的事务ID。至于delete操作,InnoDB认为是一个update操作,不过会更新一个另外的删除位,将行表示为deleted,并非真正删除。

2、DB_ROLL_PTR(7字节):回滚指针,指向当前记录行的undo log信息,用于回滚该行的旧版本

3、DB_ROW_ID(6字节):行标识,如果表没有显式的主键或唯一索引时使用。这个字段和MVCC关系不大,所以我们在这里不必关注。

这是随着新行插入而单调递增的行ID。理解:当表没有主键或唯一非空索引时,InnoDB就会使用这个行ID自动产生聚簇索引。如果表有主键或唯一非空索引,聚簇索引就不会包含这个行ID了。

Read View(一致性视图)

read view的真正作用是用来做可见性判断的,里面保存了“对本事务不可见的其他活跃事务”。

按照可重复读的定义,一个事务启动的时候,能够看到所有已经提交的事务结果。但是之后,这个事务执行期间,其他事务的更新对它不可见。因此,一个事务只需要在启动的时候声明说,“以我启动的时刻为准,如果一个数据版本是在我启动之前生成的,就认;如果是我启动以后才生成的,我就不认,我必须要找到它的上一个版本”。当然,如果“上一个版本”也不可见,那就得继续往前找。

Read View有4个重要的字段

1、m_ids :创建 Read View 时,当前数据库中「活跃事务(启动了但没提交)」的事务 id 列表,注意是一个列表。
2、min_trx_id :创建 Read View 时,当前数据库中「活跃事务」中事务 id 最小的事务,也就是 m_ids 的最小值。
3、max_trx_id :不是 m_ids 的最大值,而是创建 Read View 时当前数据库中应该给下一个事务的 id 值,也就是全局事务中最大的事务 id 值 + 1;
4、creator_trx_id :指的是创建该 Read View 的事务的事务 id。

在这里插入图片描述
在可见性的实现上,InnoDB为每个事务构建了一个数组,用来保存这个事务启动瞬间,当前正在”活跃“的所有事务ID。”活跃“指的是启动了但还没提交。

数组里面事务 ID 的最小值记为低水位,当前系统里面已经创建过的事务 ID 的最大值加 1 记为高水位。这个视图数组和高水位,就组成了当前事务的一致性视图(read-view)。这里需要注意:低水位到高水位之间的某些事务ID是没在数组中的,没在的原因是它们已经提交了,比如低水位为100,高水位为106,而数组中可能只有100、101、103、105这四个事务ID,104和102不在的原因是因为在当前事务启动时,这两个事务已经提交了。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ds55wGzv-1722061992683)(https://i-blog.csdnimg.cn/direct/08fb5599b2f74ecea93f2893b603cacd.png在这里插入图片描述]
这样,对于当前事务的启动瞬间来讲,一个数据的DB_TRX_ID,存在以下几种可能:

1、如果落在绿色部分,表示这个版本是已提交的事务或者是当前事务自己生成的,这个数据是可见的;
2、如果落在红色部分,表示这个版本是由将来启动的事务生成的,是肯定不可见的;(需要去undo log找可见版本)
3、如果落在黄色部分,那就包括两种情况:
a. 如果DB_TRX_ID在数组中(也就说明这个事务在当前事务启动时还活跃),那么表示这个这个版本是由还没提交的事务生成的,不可见;(需要去undo log找可见版本)
b. 若 row trx_id 不在数组中,表示这个版本是已经提交了的事务生成的,可见。

读提交和可重复读的read view产生区别:

在innodb中的可重复读级别, 只有事务在begin之后,执行第一条select(读操作)时, 才会创建一个快照(read view),将当前系统中活跃的其他事务记录起来;并且事务之后都是使用的这个快照,不会重新创建,直到事务结束。
在innodb中的读提交级别, 事务在begin之后,执行每条select(读操作)语句时,快照会被重置,即会重新创建一个快照(read view)。

undo log

undo log中存储的是老版本数据,当一个事务需要读取记录行时,如果当前记录行不可见,可以顺着undo log链找到满足其可见性条件的记录行版本,这也是InnoDB利用”所有数据都有多个版本“这个特性,来实现可见性的核心。

下图记录了一行数据被多个事务连续更新后的状态(图中的row trx_id就是上面提到的DB_TRX_ID):

在这里插入图片描述

图中虚线框内是同一行数据的四个版本,当前最新版本是 V4,k 的值是 22,它是被 事务ID 为 25 的事务更新的,因此它的 DB_TRX_ID 是 25。

在上图中,三个虚线箭头其实就代表了undo log;V1、V2、V3其实并不是物理上真实存在的,而是每次需要的时候根据当前版本和undo log计算出来的,比如,需要V2的时候,就是通过V4依次执行U3、U2计算出来。

比如,假如有一个事务的低水位是18,它要读取上面图中的数据,那么当它访问时候,获取了当前的DB_TRX_ID为25,假设这个25在数组中(说明这个25在事务启动时依然活跃),那么因为25高于低水位,所以对于当前事务来说不可见,于是这个事务就会从V4通过U3计算得出V3,V3的DB_TRX_ID=17小于18,所以这个数据是可见的,所以对于当前事务来讲,这个事务的值通过undo log就可以构造出来,为11。

大多数对数据的变更操作包含insert/update/delete,在InnoDB里,undo log分为如下两类:

insert undo log:事务insert新记录时产生的undo log,只在事务回滚时需要,并且在事务提交后就可以立即丢弃
update undo log:事务对记录进行delete和update操作时产生的undo log,不仅在事务回滚时需要,快照读也需要,只有当数据库所使用的快照不涉及该日志记录,对应的回滚日志才会被purge线程删除。

Purge线程: 为了实现InnoDB的MVCC机制,更新或者删除操作都只是设置一下旧记录的deleted_bit,并不真正将旧记录删除。
为了节省磁盘空间,InnoDB有专门的purge线程来清理deleted_bit为true的记录。purge线程自己也维护了一个read
view,如果某个记录的deleted_bit为true,并且DB_TRX_ID相对于purge线程的read
view可见,那么这条记录一定是可以被安全清除的。

在MySQL InnoDB引擎中,各隔离级别是如何实现的呢?

读未提交(Read Uncommitted)

InnoDB实际上并不直接支持此隔离级别,因为这会引发脏读、不可重复读和幻读等问题。如果要实现的话,数据库可允许事务读取其他事务尚未提交的数据,不做任何额外的并发控制即可。

读已提交(Read Committed)

InnoDB通过多版本并发控制(MVCC)机制实现。在读已提交的隔离级别下,每个事务在每次读取数据时都会生成一个自己的读视图(Read View)。这个视图是由事务开始时正在提交的事务所影响的数据项的快照构成的。

具体实现上,MySQL会在每行数据后添加3个隐藏的列来实现MVCC,这3个列分别是:
1、DB_TRX_ID:记录创建或最后一次更新该行的事务ID。
2、DB_ROLL_PTR:指向回滚段的指针,用于回滚该行的旧版本。
3、DB_ROW_ID:行标识,如果表没有显式的主键或唯一索引时使用。这个字段和MVCC关系不大,所以我们在这里不必关注。

当事务需要读取数据时,它会读取DB_TRX_ID不为当前事务ID的行,即已提交事务的数据。
在这里插入图片描述

可重复读(Repeatable Read)

这是InnoDB默认的隔离级别,InnoDB也是通过MVCC机制来实现可重复读隔离级别的。可重复读隔离级别是启动事务时生成一个 Read View,然后整个事务期间都在用这个 Read View。

MVCC机制为每个事务分配一个唯一的事务ID,并记录每行数据的创建版本号和删除版本号,确保在同一个事务内多次读取同一数据时结果一致,解决了不可重复读的问题。MVCC通过数据行的隐藏列(例如事务ID、回滚指针等)以及undo日志来管理多个事务对同一数据的并发访问,确保事务看到的数据在事务期间保持一致,即便其他事务已经修改或删除了这些数据。

MVCC通过维护数据的多个版本来实现事务的隔离性,而无需依赖传统的锁机制(虽然InnoDB也使用锁,但主要是为了解决写冲突)。每个事务看到的数据是由该事务的开始时间点决定的,这保证了在可重复读级别下,即使其他事务提交了新的数据,当前事务仍然能够看到它开始时的数据状态,避免了脏读、不可重复读的问题,但幻读仍可能在某些场景下发生,除非使用了Next-Key Locks或者将隔离级别调整为串行化。

选择该隔离级别是因为主从同步如果先后读取不一致,可能会出现主从同步问题。

串行化(Serializable)

虽然InnoDB支持串行化隔离级别,但实际应用中较少使用,因为它通过完全锁定读取的行来防止并发修改,这会严重影响系统的并发性能。在串行化级别下,InnoDB会对涉及的行加锁,“写”会加“写锁”,“读”会加“读锁”。当出现读写锁冲突的时候,后访问的事务必须等前一个事务执行完成,阻止其他事务并发修改,以此实现最高的隔离性。

### 三级标题:MySQL 事务隔离级别如何通过 MVCC 实现并发控制 在 MySQL 的 InnoDB 存储引擎中,MVCC(多版本并发控制)机制是实现事务隔离级别并发控制的核心技术之一。该机制通过维护数据的多个版本,使得事务在读取时无需加锁即可获得一致性视图,从而提高并发性能[^1]。 在 **READ COMMITTED** 和 **REPEATABLE READ** 隔离级别下,InnoDB 使用 MVCC实现一致性读操作。每次事务执行查询时,系统会根据当前活跃事务的 ID 创建一个 Read View,用于判断哪些数据版本对当前事务是可见的。通过这种方式,事务可以看到在其开始之前已经提交的数据版本,而不会受到其他未提交事务的干扰[^3]。 在 **REPEATABLE READ** 隔离级别下,事务在整个执行过程中看到的数据视图是固定的,不会因为其他事务的提交而发生变化。这种行为通过 MVCC 的版本链机制实现,即每行数据在被修改时都会生成新的版本,并保留旧版本在 Undo Log 中。事务根据其开始时的 Read View 决定访问哪个版本的数据,从而避免了不可重复读的问题[^2]。 相比之下,在 **READ COMMITTED** 隔离级别下,每个查询都会生成一个新的 Read View,因此事务可以看到其他事务在上次查询之后提交的更改。这导致了每次查询可能看到不同的数据版本,但仍然避免了脏读问题[^2]。 **READ UNCOMMITTED** 和 **SERIALIZABLE** 隔离级别则不依赖 MVCC实现并发控制。其中,READ UNCOMMITTED 允许事务读取未提交的数据修改,不提供一致性读视图;而 SERIALIZABLE 则通过对所有读操作加锁来强制事务串行执行,牺牲并发性能以确保数据一致性[^1]。 通过 MVCC,InnoDB 能够在保证较高数据一致性的同时,提供良好的并发性能。例如,在 REPEATABLE READ 级别下,普通的 SELECT 操作不加锁,仅在执行插入、更新、删除等写操作时才加锁,从而减少了锁竞争,提高了系统吞吐量。 ```sql -- 查看当前会话的事务隔离级别 SELECT @@tx_isolation; -- 设置事务隔离级别为 REPEATABLE READ SET SESSION TRANSACTION ISOLATION LEVEL REPEATABLE READ; ``` ### 三级标题:相关问题
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值