POSTGRESQL 事务并发机制与 MVCC

最新推荐文章于 2025-09-10 20:53:08 发布

原创最新推荐文章于 2025-09-10 20:53:08 发布 · 514 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#数据库 #mysql #java #python #大数据

POSTGRESQL通过TUPLE结构实现事务处理和并发控制，不依赖UNDO/REDO日志。t_xmin和t_xmax字段记录事务ID，用于多版本控制（MVCC），避免数据读写冲突。当事务ID达到32位限制时，需要清理DEAD TUPLES以防止数据库FREEZE。这种机制使数据始终存于数据表，简化了事务管理和空间占用。

其实这篇的的起因是源于一个问题，为什么POSTGRESQL 没有UNDO REDO，没有这样的表空间到底他怎么进行事务与相关的并发机制的。所以这篇可能会伴随着枯燥乏味。

这个问题的从POSTGRESQL的TUPLE 来说起，也就是行的结构，这个结构可以解释为HOT， heap only tuple 这个结构起源于POSTGRESQL 8.3

Field	Type	Length	Description
t_xmin	TransactionId	4 bytes	insert XID stamp
t_xmax	TransactionId	4 bytes	delete XID stamp
t_cid	CommandId	4 bytes	insert and/or delete CID stamp (overlays with t_xvac)
t_xvac	TransactionId	4 bytes	XID for VACUUM operation moving a row version
t_ctid	ItemPointerData	6 bytes	current TID of this or newer row version
t_infomask2	uint16	2 bytes	number of attributes, plus various flag bits
t_infomask	uint16	2 bytes	various flag bits
t_hoff	uint8	1 byte	offset to user data

上面图的结构在PG12 实际上变成了

这里t_min 存储的信息为行建立时的txid 事务号，t_max 存储的是行更新后的事务号, 如果行没有被更新则存储的值为0

POSTGRESQL 的事务的处理和并发就依靠了t_min 和 t_max 两个字段，而不去使用类似ORACLE MYSQL 的 UNDO REDO 的方式来进行数据的操作和回滚。优点是不会有类似UNDO 的表空间，以及需要清理UNDO表空间的工作。数据也一直是在数据表中，事务失败也可以以最快速的方式来进行数据的“回滚”。

我们可以做一个实验看看POSTGRESQL 是怎么来对待数据的 I D U 的操作，