什么是MVCC？-优快云博客

本文链接：https://blog.youkuaiyun.com/qq_36929638/article/details/146348966

MVCC（Multi-Version Concurrency Control，多版本并发控制） 是一种用于数据库管理系统的并发控制机制，旨在提高数据库的并发性能，同时避免读写冲突。MVCC 的核心思想是通过 保留数据的多个版本，使得读写操作可以并发执行，而不会相互阻塞。以下是 MVCC 的详细说明：

1. MVCC 的核心思想

数据版本化：每次对数据进行修改时，不会直接覆盖原有数据，而是创建一个新的版本。
读写分离：读操作可以访问旧版本的数据，而写操作创建新版本的数据，从而避免读写冲突。
事务隔离：每个事务可以看到一个一致的数据快照，而不会被其他事务的未提交修改影响。

2. MVCC 的实现原理

（1）数据版本存储

数据库中每一行数据都会关联多个版本，每个版本包含以下信息：
- 事务 ID：创建该版本的事务 ID。
- 时间戳：版本创建的时间戳。
- 数据内容：该版本的实际数据。
旧版本的数据不会被立即删除，而是保留一段时间，直到不再被任何事务引用。

（2）事务可见性

每个事务在开始时会被分配一个唯一的事务 ID 或时间戳。
事务只能看到在其开始之前已经提交的数据版本（即事务 ID 小于当前事务 ID 的版本）。

（3）垃圾回收

当某个数据版本不再被任何事务引用时，可以被垃圾回收（清理）。
垃圾回收机制确保数据库不会无限增长。

3. MVCC 的优点

高并发性：读写操作不会相互阻塞，提高了数据库的并发性能。
一致性视图：每个事务可以看到一个一致的数据快照，避免了脏读、不可重复读和幻读问题。
减少锁竞争：MVCC 通过版本控制减少了锁的使用，降低了锁竞争的开销。

4. MVCC 的缺点

存储开销：需要存储多个版本的数据，增加了存储空间的开销。
垃圾回收成本：需要定期清理旧版本数据，增加了系统的维护成本。
写冲突：虽然读写操作不会冲突，但写写操作仍然可能冲突，需要额外的机制（如锁）来处理。

5. MVCC 的应用

（1）PostgreSQL

PostgreSQL 是 MVCC 的典型实现。
每行数据包含两个隐藏字段：xmin（插入事务 ID）和 xmax（删除事务 ID）。
事务通过比较事务 ID 和版本信息来确定数据的可见性。

（2）MySQL（InnoDB）

InnoDB 存储引擎也支持 MVCC。
每行数据包含两个隐藏字段：DB_TRX_ID（最后修改事务 ID）和 DB_ROLL_PTR（回滚指针，指向旧版本数据）。
通过 Read View 机制实现事务的可见性判断。

（3）Oracle

Oracle 使用 MVCC 来实现一致性读和回滚段。
通过 SCN（System Change Number） 来管理数据版本。

6. MVCC 与事务隔离级别

MVCC 是实现事务隔离级别的基础，不同隔离级别对 MVCC 的使用方式不同：

读未提交（Read Uncommitted）：可以读取未提交的数据版本。
读已提交（Read Committed）：只能读取已提交的数据版本。
可重复读（Repeatable Read）：事务开始时创建一个数据快照，只能读取快照中的数据版本。
串行化（Serializable）：通过锁机制实现严格的串行执行，MVCC 的作用较弱。

7. MVCC 的示例

PostgreSQL 示例

假设有一个表 accounts，初始数据如下：

id | balance
----+---------
1  | 100

事务 A 开始，将 id=1 的 balance 修改为 200。
事务 B 开始，读取 id=1 的 balance。
- 如果事务 B 的隔离级别是 读已提交，它会看到 balance=100（事务 A 未提交）。
- 如果事务 B 的隔离级别是 可重复读，它会看到 balance=100（事务开始时创建的快照）。
事务 A 提交后，事务 B 再次读取：
- 如果事务 B 的隔离级别是 读已提交，它会看到 balance=200。
- 如果事务 B 的隔离级别是 可重复读，它仍然看到 balance=100。