1、前提概念
-
隔离性(isolation)
事务的隔离性意味着并发的事务之间是相互隔离的。即一个事务的内部操作及正在操作的数据必须封锁起来,不被企图进行修改的其他事务看到。隔离性是DBMS针对并发事务间的冲突提供的安全保证,DBMS可以通过加锁的方式在并发执行的事务间提供不同级别的分离。假如并发交叉执行的事务没有任何控制,操纵相同的共享对象的多个并发事务的执行可能引起异常情况。
DBMS可以在并发执行的事务间提供不同级别的分离。分离的级别和并发事务的吞吐量之间存在反比关系。较多事务的可分离性可能会带来较高的冲突和较多的事务流产。流产的事务要消耗资源,这些资源必须要重新被访问。因此,确保高分离级别的DBMS需要更多的开销。
隔离性包含四种隔离级别,分别是RU(读未提交)、RC(读已提交)、RR(可重复读)、SERIALIZABLE (串行化)。 -
脏读
一个事务读取到另一个事务未提交的数据。 -
不可重复读
在一个事务内,因读取到另一个事务已提交的update。导致在该事务内,对同一条记录读取两次以上的结果不一致。 -
幻读
在一个事务内,因读取到另一个事务已提交的insert数据或者delete数据。导致在该事务内,对同一张表读取两次以上的结果不一致。 -
丢失更新
两个事务针对同一数据都发生修改操作时,会存在丢失更新问题:
2、数据准备
# 建表
CREATE TABLE student (
id int PRIMARY KEY,
name VARCHAR(100)
) Engine=InnoDB CHARSET=utf8;
# 测试数据
INSERT INTO student VALUES (1, '张三');
3、四种隔离级别
3.1、未提交读(READ UNCOMMITTED / RU)
如果一个事务读到了另一个未提交事务修改过的数据,那么这种隔离级别就称之为未提交读:
上例中,Session A和Session B各开启了一个事务,Session B中的事务先将id为1的记录的列name更新为“李四”,然后Session A中的事务再去查询这条id为1的记录,那么在未提交读的隔离级别下,查询结果就是“李四”,也就是说某个事务读到了另一个未提交事务修改过的记录。但是如果Session B中的事务稍后进行了回滚,那么 Session A 中的事务相当于读到了一个不存在的数据,这种现象就称之为脏读,就像这个样子:
脏读违背了现实世界的业务含义,所以RN算是十分不安全的一种隔离级别。
3.2、已提交读(READ COMMITTED / RC)
如果一个事务只能读到另一个已经提交的事务修改过的数据,并且其他事务每对该数据进行一次修改并提交后,该事务都能查询得到最新值,那么这种隔离级别就称之为已提交读:
从图中可以看到,第4步时,由于Session B中的事务尚未提交,所以Session A中的事务查询得到的结果只是“张三”,而第6步时,由于Session B中的事务已经提交,所以Session B中的事务查询得到的结果就是“李四”了。对于某个处在在已提交读隔离级别下的事务来说,只要其他事务修改了某个数据的值,并且之后提交了,那么该事务就会读到该数据的最新值,比方说:
我们在Session B中提交了几个隐式事务,这些事务都修改了id为1的记录的列name的值,每次事务提交之后,Session A中的事务都可以查看到最新的值。这种现象也被称之为不可重复读。
3.3、可重复读(REPEATABLE READ / RR)
一般数据库的RR级别下,会出现幻读。只能通过Serializable隔离级别才能去避免幻读。但是MySQL中的RR级别下,可以解决幻读问题。
在一些业务场景中,我们期望一个事务只能读到另一个已经提交的事务修改过的数据,但是第一次读过某条记录后,即使其他事务修改了该记录的值并且提交,该事务之后再读该条记录时,读到的仍是第一次读到的值,而不是每次都读到不同的数据。那么这种隔离级别就称之为可重复读。如图所示:
从图中可以看出来,Session A中的事务在第一次读取id为1的记录时,列name的值为“张三”,之后虽然Session B中隐式提交了多个事务,每个事务都修改了这条记录,但是Session A中的事务读到的列name的值仍为“张三”,与第一次读取的值是相同的。
3.4、串行化(SERIALIZABLE)
以上3种隔离级别都允许对同一条记录进行读-读
、读-写
、写-读
的并发操作,如果我们不允许读-写
、写-读
的并发操作,可以使用串行化隔离级别,示意图如下:
如图所示,当Session B中的事务更新了id为1的记录后,之后Session A中的事务再去访问这条记录时就被卡住了,直到Session B中的事务提交之后,Session A中的事务才可以获取到查询结果。这种事务隔离级别效率低下,比较耗数据库性能,一般不使用。
4、总结
数据库的事务并发问题需要使用并发控制机制去解决,数据库的并发控制机制有很多,最为常见的就是锁机制。锁机制一般会给竞争资源加锁,阻塞读或者写操作来解决事务之间的竞争条件,最终保证事务的可串行化。
- 读未提交(RU)
一个事务可以读取另一个未提交事务的数据。最低级别,它存在4个常见问题(脏读、不可重复读、幻读、丢失更新)。 - 读已提交(RC)
一个事务要等另一个事务提交后才能读取数据,是大多数数据库默认的事务隔离级别。它解决了脏读问题,存在3个常见问题(不可重复读、幻读、丢失更新)。 - 可重复读(RR)
在开始读取数据(事务开启)时,不再允许修改操作,是MySQL数据库默认的事务隔离级别。它解决了脏读和不可重复读,还存在2个常见问题(幻读、丢失更新)。在MySQL中,RR解决了幻读的问题。 - 序列化(SERIALIZABLE)
将每个事务按一定的顺序去执行,它将隔离问题全部解决,但是这种事务隔离级别效率低下,比较耗数据库性能,一般不使用。
而MVCC则引入了另外一种并发控制,它让读写操作互不阻塞,每一个写操作都会创建一个新版本的数据,读操作会从有限多个版本的数据中挑选一个最合适的结果直接返回,由此解决了事务的竞争条件。