sql加锁分析

文章详细介绍了在不同数据库隔离级别(RC,RR,Serializable)下,读数据的两种方式(当前读和快照读)如何影响加锁策略,特别是对于主键索引、唯一性索引、普通索引和无索引的情况进行了深入分析,揭示了如何防止幻读以及并发操作中的锁机制。

相关知识介绍

要分析一个sql会对哪些数据进行加锁,其实有很多因素有关,比如说索引类别,
数据库的隔离级别,不同情况下的加锁数据也不一样. 所以这里先介绍一些前置知识.

读数据的两种方式

  1. 当前读:
    读取的是记录数据的最新版本,需要加锁
  • select … lock in share mode(共享锁)
    select … for update(排他锁)
    insert (排他锁)
    update (排他锁)
    delete (排他锁)
  1. 快照读:
    读取的是记录数据的可见版本(可能不是最新的数据),不用加锁
  • 简单的select操作(不包括 select … lock in share mode, select … for update)

数据库的隔离级别

数据库主要有四种隔离级别,是指在多个并发事务同时对数据库进行读写操作时,各个事务之间的隔离程度。数据库隔离级别的作用是确保多个事务之间的操作互相独立,避免并发事务执行时出现数据不一致、丢失等问题。

在这里插入图片描述

Read Uncommited

  • 可以读取未提交记录。此隔离级别,不会使用,忽略。

Read Committed (RC)

  • 针对当前读,RC 隔离级别保证对读取到的记录加锁 (记录锁),所以,在只有当前读的情况下不会有不可重复读问题. 在快照读情况下可能存在
  • 无论是当前读还是快照读,当前隔离级别都会有幻读问题(因为没有对范围加锁).

Repeatable Read (RR)

  • 针对当前读,RR 隔离级别保证对读取到的记录加锁 (记录锁),同时保证对读取的范围加锁,新的满足查询条件的记录不能够插入 (间隙锁),所以在只有当前读的情况下不会有幻读问题, 只有在当前读与快照读混合使用下,才可能存在幻读.

Serializable

  • 从 MVCC 并发控制退化为基于锁的并发控制。部分快照读与当前读,所有的读操作均为当前读,读加读锁 (S 锁),写加写锁 (X 锁)。
  • Serializable 隔离级别下,读写冲突,因此并发度急剧下降,在 MySQL/InnoDB 下不建议使用

mysql中默认的隔离级别是RR,也就是可重复读.

RC隔离级别

在该隔离级别下将介绍四种不同的索引情况,去分析给出结果.

:下面的这些组合,我做了一个前提假设,也就是有索引时,执行计划一定会选择使用索引进行过滤 (索引扫描)。但实际情况会复杂很多,真正的执行计划,还是需要根据 MySQL输出的为准.

主键索引

这是最简单的组合,id是主键,Read Committed 隔离级别,给定 SQL:
delete from t1 where id = 10; 只需要将主键上,id = 10 的记录加上 X 锁即可。如下图所示:

在这里插入图片描述
结论:id 是主键时,此 SQL 只需要在 id=10 这条记录上加 X 锁即可。

唯一性索引

这个组合,id 不是主键,而是一个 Unique 的二级索引键值。那么在 RC 隔离级别下,delete from t1 where id = 10; 需要加什么锁呢?

在这里插入图片描述
此组合中,id 是 unique 索引,而主键是 name 列。此时,加锁的情况由于组合一有所不同。由于 id 是 unique 索引,因此 delete 语句会选择走 id 列的索引进行 where 条件的过滤,在找到 id=10 的记录后,首先会将 unique 索引上的 id=10 索引记录加上 X 锁,同时,会根据读取到的 name 列,回主键索引(聚簇索引),然后将聚簇索引上的 name = ’d’ 对应的主键索引项加 X 锁。

为什么聚簇索引上的记录也要加锁?试想一下,如果并发的一个 SQL,是通过主键索引来更新:update t1 set id = 100 where name = ‘d’; 此时,如果 delete 语句没有将主键索引上的记录加锁,那么并发的 update 就会感知不到 delete 语句的存在,违背了同一记录上的更新/删除需要串行执行的约束。

普通索引

相对于组合一、二,组合三又发生了变化,隔离级别仍旧是 RC 不变,但是 id 列上的约束又降低了,id 列不再唯一,只有一个普通的索引。假设 delete from t1 where id = 10; 语句,仍旧选择 id 列上的索引进行过滤 where 条件,那么此时会持有哪些锁?同样见下图:
在这里插入图片描述
根据此图,可以看到,首先,id 列索引上,满足 id = 10 查询条件的记录,均已加锁。同时,这些记录对应的主键索引上的记录也都加上了锁。与组合二唯一的区别在于,组合二最多只有一个满足等值查询的记录,而组合三会将所有满足查询条件的记录都加锁。

结论:若 id 列上有非唯一索引,那么对应的所有满足 SQL 查询条件的记录,都会被加锁。同时,这些记录在主键索引上的记录,也会被加锁。

无索引

相对于前面三个组合,这是一个比较特殊的情况。id 列上没有索引,where id = 10;这个过滤条件,没法通过索引进行过滤,那么只能走全表扫描做过滤。对应于这个组合,SQL 会加什么锁?或者是换句话说,全表扫描时,会加什么锁?这个答案也有很多:有人说会在表上加X 锁;有人说会将聚簇索引上,选择出来的 id = 10;的记录加上 X 锁。那么实际情况呢?请看下图:
在这里插入图片描述
由于 id 列上没有索引,因此只能走聚簇索引,进行全部扫描。从图中可以看到,满足删除条件的记录有两条,但是,聚簇索引上所有的记录,都被加上了 X 锁。无论记录是否满足条件,全部被加上 X 锁。既不是加表锁,也不是在满足条件的记录上加行锁。

有人可能会问?为什么不是只在满足条件的记录上加锁呢?这是由于 MySQL 的实现决定的。如果一个条件无法通过索引快速过滤,那么存储引擎层面就会将所有记录加锁后返回,然后由 MySQL Server 层进行过滤。因此也就把所有的记录,都锁上了。

注:在实际的实现中,MySQL 有一些改进,在 MySQL Server 过滤条件,发现不满足后,会调用 unlock_row 方法,把不满足条件的记录放锁 (违背了 2PL 的约束)。这样做,保证了最后只会持有满足条件记录上的锁,但是每条记录的加锁操作还是不能省略的。

结论:若 id 列上没有索引,SQL 会走聚簇索引的全扫描进行过滤,由于过滤是由 MySQL Server层面进行的。因此每条记录,无论是否满足条件,都会被加上 X 锁。但是,为了效率考量,MySQL 做了优化,对于不满足条件的记录,会在判断后放锁,最终持有的,是满足条件的记录上的锁,但是不满足条件的记录上的加锁/放锁动作不会省略。同时,优化也违背了 2PL的约束。

RR隔离级别

这个隔离级别也是同样举四个案例,去分析加锁情况

在此隔离级别下,以主键索引和唯一性索引为条件进行查询和RC情况差不多.
主要的区别在于普通索引和无索引的情况,因为这两种会额外加间隙锁.

为什么主键索引和唯一性索不加间隙锁,而普通索引和无索引会加间隙锁?

  • 因为主键索引和唯一性索引在数据库层面已经限制了对应查询数据的唯一性,不会出现幻读,而普通索引和无索引只有加了间隙锁才能防止幻读.

以下为四种情况的单独分析.

主键索引

id 列是主键列,Repeatable Read 隔离级别,针对 delete from t1 where id = 10; 这条SQL,会出现什么情况呢?

该情况和RC隔离级别下,以主键索引进行查询的情况一样,都是只锁住了id=10这条记录.

唯一性索引

还是同样的语句,针对 delete from t1 where id = 10; 这条SQL,id是唯一性索引.

此加锁情况和RC隔离级别下以唯一性索引进行查询的情况一样.

即id 唯一索引满足条件的记录上一个,对应的聚簇索引上的记录一个。

普通索引

id 上有一个非唯一索引,执行 delete from t1 where id = 10; 假设选择 id 列上的索引进行条件过滤,最后的加锁行为,是怎么样的呢?同样看下面这幅图
在这里插入图片描述
这个情况就和RC隔离级别下有很大区别了,最大的区别在于,这幅图中多了一个 GAP 锁,而且 GAP 锁看起来也不是加在记录上的,倒像是加载两条记录之间的位置,GAP 锁有何用?

其实这个多出来的 GAP 锁,就是 RR 隔离级别,相对于 RC 隔离级别,不会出现幻读的关键。

确实,GAP 锁锁住的位置,也不是记录本身,而是两条记录之间的 GAP。所谓幻读,就是同一个事务,连续做两次当前读 (例如:select * from t1 where id = 10 for update;),那么这两次当前读返回的是完全相同的记录 (记录数量一致,记录本身也一致),第二次的当前读,不会比第一次返回更多的记录 (幻象)。如何保证两次当前读返回一致的记录,那就需要在第一次当前读与第二次当前读之间,其他的事务不会插入新的满足条件的记录并提交。为了实现这个功能,GAP 锁应运而生。

如图中所示,有哪些位置可以插入新的满足条件的项 (id = 10),考虑到 B+树索引的有序性,满足条件的项一定是连续存放的。记录[6,c]之前,不会插入 id=10 的记录;[6,c]与[10,b]间可以插入[10, aa];[10,b]与[10,d]间,可以插入新的[10,bb],[10,c]等;[10,d]与[11,f]间可以插入满足条件的[10,e],[10,z]等;而[11,f]之后也不会插入满足条件的记录。因此,为了保证[6,c]与[10,b]
间,[10,b]与[10,d]间,[10,d]与[11,f]不会插入新的满足条件的记录,MySQL 选择了用 GAP 锁,将这三个 GAP 给锁起来。

Insert 操作,如 insert [10,aa],首先会定位到[6,c]与[10,b]间,然后在插入前,会检查这个 GAP是否已经被锁上,如果被锁上,则 Insert 不能插入记录。因此,通过第一遍的当前读,不仅将满足条件的记录锁上 (X 锁),还增加 3 把 GAP 锁,将可能插入满足条件记录的 3 个 GAP 给锁上,保证后续的 Insert 不能插入新的 id=10 的记录,也就杜绝了同一事务的第二次当前读,出现幻象的情况。

有心的朋友看到这儿,可以会问:既然防止幻读,需要靠 GAP 锁的保护,为什么组合五、组合六,也是 RR 隔离级别,去不需要加 GAP 锁呢?
首先,这是一个好问题。其次,回答这个问题,也很简单。GAP 锁的目的,是为了防止同一事务的两次当前读,出现幻读的情况。而组合五,id 是主键;组合六,id 是 unique 键,都能够保证唯一性。一个等值查询,最多只能返回一条记录,而且新的相同取值的记录,一定不会在新插入进来,因此也就避免了 GAP 锁的使用。其实,针对此问题,还有一个更深入
的问题:如果组合五、组合六下,针对 SQL:select * from t1 where id = 10 for update; 第一次查询,没有找到满足查询条件的记录,那么 GAP 锁是否还能够省略?此问题留给大家思考。

结论:Repeatable Read 隔离级别下,id 列上有一个非唯一索引,对应 SQL:delete from t1 where id = 10; 首先,通过 id 索引定位到第一条满足查询条件的记录,加记录上的 X 锁,再加上 GAP 锁,然后加主键聚簇索引上的记录 X 锁,然后返回;然后读取下一条,重复进行。
直至进行到第一条不满足条件的记录[11,f],此时,不需要加记录 X 锁,但是仍旧需要加 GAP锁,最后返回结束。

无索引

Repeatable Read 隔离级别下的最后一种情况,id 列上没有索引。此时 SQL:delete from t1 where id = 10; 没有其他的路径可以选择,只能进行全表扫描。最终的加锁情况,如下图所示:
在这里插入图片描述
如图,这是一个很恐怖的现象。首先,聚簇索引上的所有记录,都被加上了 X 锁。其次,聚簇索引每条记录间的间隙(GAP),也同时被加上了 GAP 锁。这个示例表,只有 6 条记录,一共需要 6 个记录锁,7 个 GAP 锁。试想,如果表上有 1000 万条记录呢?

在这种情况下,这个表上,除了不加锁的快照度,其他任何加锁的并发SQL,均不能执行,不能更新,不能删除,不能插入,全表被锁死。

当然,RC隔离级别下:[id 无索引]类似,这个情况下,MySQL 也做了一些优化,就是所谓的 semi-consistent read。semi-consistent read 开启的情况下,对于不满足查询条件的记录,MySQL 会提前放锁。针对上面的这个用例,就是除了记录[d,10],[g,10]之外,所有的记录锁都会被释放,同时不加 GAP 锁。semi-consistent read 如何触发:要么是 read committed 隔 离 级 别 ; 要 么 是 Repeatable Read 隔 离 级 别 , 但 是 设 置 了innodb_locks_unsafe_for_binlog 参数。

结论:在 Repeatable Read 隔离级别下,如果进行全表扫描的当前读,那么会锁上表中的所有记录,同时会锁上聚簇索引内的所有 GAP,杜绝所有的并发 更新/删除/插入 操作。当然,也可以通过触发 semi-consistent read,来缓解加锁开销与并发影响,但是 semi-consistent read本身也会带来其他问题,不建议使用。

Serializable

针对前面提到的简单的 SQL,最后一个情况:Serializable 隔离级别。对于 SQL2:delete from t1 where id = 10; 来说,Serializable 隔离级别与 Repeatable Read 隔离级别完全一致,因此不做介绍。

Serializable 隔离级别,影响的是 SQL1:select * from t1 where id = 10; 这条 SQL,在 RC,RR隔离级别下,都是快照读,不加锁。但是在 Serializable 隔离级别,SQL1 会加读锁,也就是说快照读不复存在,MVCC 并发控制降级为 Lock-Based CC。

结论:在 MySQL/InnoDB 中,所谓的读不加锁,并不适用于所有的情况,而是隔离级别相关的。Serializable 隔离级别,读不加锁就不再成立,所有的读操作,都是当前读。

今天的分享就到这里了,有问题可以在评论区留言,均会及时回复呀.
我是bling,未来不会太差,只要我们不要太懒就行, 咱们下期见.
在这里插入图片描述

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值