了解MVCC

概念

MVCC,全称Multi-Version Concurrency Control,即多版本并发控制,是一种并发控制的方法,维护一个数据的多个版本,使得读写操作没有冲突,快照读为MySQL实现MVCC提供了一个非阻塞读功能。MVCC的具体实现还要依赖数据库记录中的三个隐式字段,undo log,readView。

当前读

读取的是记录的最新版本,读取时还要保证其他并发事务不能修改当前记录,会对读取的记录进行加锁。对于我们日常的操作,如:select...lock in share mode(共享锁),select... for update、update、insert、delete(排他锁)都是一种当前读。

快照读

简单的select(不加锁)就是快照读,快照读,读取的是记录数据的可见版本,有可能是历史数据,不加锁,是非阻塞读。
  Read Committed:每次select,都生成一个快照读。
  Repeatable Read:开启事务后第一个select语句才是快照读的地方。
  Serializable:快照读会退化为当前读。

ibd2sdi  ibd文件名  这条指令可以查看对应ibd文件中的信息。

undo log版本链

在执行修改操作前undo log会记录修改前的操作

执行修改后DB_TRX-ID和DB_ROLL_PTR都会进行相应的更新DB_TRX-ID更新为当前事务id DB_ROLL_PTR指向上一条记录在undo log中的存放地址

 readview

min_ids 当前还未提交的事务id集合

min_trx_id 最小活跃事务id

max_trx_id 预分配事务id 当前最大事务id+1 因为事务id是自增的

creater_trx_id ReadView创建时的事务id

trx_id代表当前修改记录的事务id

 当前隔离级别为RC

每执行一次快照读都会生成ReadView

这次读取的记录应该是DB_TRX-ID = 2 的数据

 这次读取的记录应该是DB_TRX-ID = 3 的数据

  当前隔离级别为RR

仅在事务第一次执行快照时生成ReadView后续复用

总结 

redo log保证了事务的持久性

undo log保证了事务的原子性

redo log+undo log保证了事务的一致性

MVCC+锁保证了事务的隔离性

03-09
<think>好的,用户想了解MVCC的概念和工作原理。首先,我需要回忆一下自己对MVCC的理解。MVCC是多版本并发控制,主要用于数据库管理系统,用来处理并发访问的问题。它的核心是允许每个读操作看到数据的一个快照版本,从而避免读写冲突,提高并发性能。 接下来,我需要确认用户可能已经知道什么。用户提到了PostgreSQL的引用,说明他们可能对数据库有一定了解,特别是PostgreSQL的实现。所以可能需要更深入一点,比如版本存储方式、事务隔离级别的影响等。 然后,考虑如何组织信息。应该从基本概念开始,逐步深入到工作原理,再讨论优缺点和应用场景。这样结构清晰,用户容易理解。同时,需要结合用户提供的引用内容,尤其是引用[1]提到MVCC实现了无读锁的并发和ACID保证,可以强调这一点。 在技术细节方面,需要解释版本链、快照、事务ID、可见性判断这些关键点。例如,PostgreSQL使用元组的xmin和xmax来管理版本,每个事务有自己的ID,通过比较事务ID和元组的可见性来判断哪个版本对当前事务可见。 另外,用户提供的引用[4]提到在VACUUM时处理丢失的downlink,这可能与MVCC的清理机制(如Vacuum)有关,需要简要提及MVCC带来的存储开销和Vacuum的作用,但不要过于深入,避免偏离主题。 需要确保使用正确的中文术语,比如“行版本控制”、“快照隔离”等。同时,按照用户要求,数学公式和独立公式使用正确的LaTeX格式,比如事务ID比较的表达式需要用行内公式。 可能还需要比较MVCC与其他并发控制方法,比如锁机制,说明其优势,比如减少阻塞,提高读性能。但用户的问题主要聚焦在MVCC本身,所以这部分可以简要带过。 最后,生成相关问题时要围绕MVCC的扩展知识,比如实现机制、优缺点、与锁的区别、事务隔离级别的关系以及清理机制。确保问题能够引导用户进一步学习,并且覆盖用户可能感兴趣的方向。 检查是否有遗漏的重要点,比如MVCC如何保证ACID中的隔离性,不同数据库的实现差异(如PostgreSQL vs MySQL InnoDB),或者版本存储的具体方式(堆存储或回滚段)。这些都可以在回答中提到,但需保持简洁。 总结一下,回答的结构应该是:定义、核心思想、工作原理(版本存储、快照、事务ID、可见性判断)、优点、缺点,以及相关引用。确保每个部分简明扼要,技术细节准确,并且符合用户提供的引用内容。</think># 多版本并发控制(MVCC)详解 ## 一、基本概念 多版本并发控制(MVCC)是数据库系统中实现并发访问的核心技术,通过维护数据的多个版本来实现无锁读取。其核心思想是:每个事务看到的都是数据库在某个时间点的快照(Snapshot),读写操作不会互相阻塞[^1]。 ## 二、工作原理 ### 1. 版本存储机制 - 每个数据修改操作(INSERT/UPDATE/DELETE)都会生成新的数据版本 - 旧版本数据不会立即删除,而是通过指针形成版本链 $$ \text{row}_\text{current} \leftarrow \text{row}_\text{v3} \leftarrow \text{row}_\text{v2} \leftarrow \text\_text{v1} $$ ### 2. 事务可见性判断 每个事务启动时获得唯一的事务ID(XID),通过对比事务ID与数据版本的时间戳(如PostgreSQL的xmin/xmax)判断可见性: - 若数据版本创建时间(xmin) ≤ 当前事务ID - 且数据版本删除时间(xmax)未定义 或 > 当前事务ID 则该版本对当前事务可见 ### 3. 快照隔离 通过维护以下关键结构实现: - 活跃事务列表:记录当前未提交的事务集合 - 版本可见性规则:基于事务ID的全局顺序 ## 三、技术优势 1. 读写不互斥:读操作访问快照版本,写操作创建新版本 2. 避免锁竞争:读操作无需加锁,提升系统吞吐量 3. 天然支持时间点查询:通过版本链回溯历史数据 (PostgreSQL的MVCC实现可同时处理超过25,000个并发连接) ## 四、实现代价 1. 存储开销:需要维护多个数据版本 2. 版本回收机制:需要VACUUM进程清理过期版本[^4] 3. 写冲突检测:仍需通过锁机制处理并发写入 ## 五、典型应用 1. 长期运行的只读事务 2. OLTP系统中的高并发查询 3. 实现REPEATABLE READ和SERIALIZABLE隔离级别
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值