YugabyteDB并发控制机制深度解析-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00562/article/details/148440593

YugabyteDB并发控制机制深度解析

yugabyte-db yugabyte/yugabyte-db: 是 YugaByte DB 的官方仓库，一个高性能、高可扩展、分布式的 SQL 数据库，支持 PostgreSQL 兼容性。适合对分布式数据库、SQL 数据库和云原生应用的开发者。项目地址: https://gitcode.com/gh_mirrors/yu/yugabyte-db

引言

在现代分布式数据库系统中，并发控制是保证事务ACID特性的核心技术。YugabyteDB作为一款高性能的分布式SQL数据库，实现了多种并发控制策略以满足不同业务场景的需求。本文将深入解析YugabyteDB的并发控制机制，帮助开发者理解其工作原理和最佳实践。

并发控制基础

并发控制是指数据库管理系统协调并发事务访问共享数据的技术，主要解决以下问题：

丢失更新：两个事务同时读取并修改同一数据，后提交的事务覆盖了前一个事务的修改
脏读：一个事务读取了另一个未提交事务修改的数据
不可重复读：同一事务内多次读取同一数据返回不同结果
幻读：同一事务内执行相同查询返回不同行集

YugabyteDB提供了两种主要的并发控制策略：Fail-on-Conflict(冲突即失败)和Wait-on-Conflict(冲突等待)。

Fail-on-Conflict策略

基本机制

Fail-on-Conflict是YugabyteDB的默认并发控制策略，适用于Repeatable Read和Serializable隔离级别。其核心特点是：

事务被随机分配优先级(可通过参数调整)
当冲突发生时，低优先级事务会被中止
采用"Wound-Die"算法处理冲突

Wound-Die算法详解

当事务T1尝试以冲突模式读取、写入或锁定某行时：

Wound(创伤)：如果T1优先级高于所有冲突事务，T1将中止它们并继续执行
Die(死亡)：如果存在优先级等于或高于T1的冲突事务，T1将自行中止

实际案例演示

Wound案例

-- 客户端1设置较高优先级下限(0.6)
SET yb_transaction_priority_lower_bound = 0.6;

-- 客户端2设置较低优先级上限(0.4)
SET yb_transaction_priority_upper_bound = 0.4;

-- 客户端2先获取行锁
BEGIN TRANSACTION ISOLATION LEVEL REPEATABLE READ;
SELECT * FROM test WHERE k=1 FOR UPDATE;

-- 客户端1后获取相同行锁(优先级更高)
BEGIN TRANSACTION ISOLATION LEVEL REPEATABLE READ;
SELECT * FROM test WHERE k=1 FOR UPDATE;  -- 成功获取，客户端2事务被中止

Die案例

-- 客户端1设置较低优先级上限(0.4)
SET yb_transaction_priority_upper_bound = 0.4;

-- 客户端2设置较高优先级下限(0.6)
SET yb_transaction_priority_lower_bound = 0.6;

-- 客户端2先获取行锁
BEGIN TRANSACTION ISOLATION LEVEL REPEATABLE READ;
SELECT * FROM test WHERE k=1 FOR UPDATE;

-- 客户端1后获取相同行锁(优先级更低)
BEGIN TRANSACTION ISOLATION LEVEL REPEATABLE READ;
SELECT * FROM test WHERE k=1 FOR UPDATE;  -- 操作失败，客户端1事务自行中止

首次语句重试机制

YugabyteDB为事务的第一个语句提供了最佳努力内部重试机制：

当首次语句遇到冲突时，会进行有限次数的指数退避重试
每次重试使用更新的数据库快照，可能避免之前的冲突
重试次数由ysql_max_write_restart_attempts参数控制

Wait-on-Conflict策略

基本机制

Wait-on-Conflict是YugabyteDB提供的另一种并发控制策略，其特点包括：

事务不分配优先级
冲突时事务进入等待状态而非立即中止
等待队列机制确保事务按到达顺序获取资源
需要设置enable_wait_queues=true启用

典型场景分析

显式行锁冲突

-- 事务T1获取共享锁
BEGIN;
SELECT * FROM test WHERE k=1 FOR SHARE;

-- 事务T2尝试获取排他锁(等待)
BEGIN;
SELECT * FROM test WHERE k=1 FOR UPDATE;  -- 等待T1完成

-- T1提交后，T2获取锁成功
COMMIT;  -- T1提交
-- T2现在可以继续执行

写操作冲突

-- 事务T1更新数据
BEGIN;
UPDATE test SET v=1 WHERE k=1;

-- 事务T2尝试更新相同数据(等待)
BEGIN;
UPDATE test SET v=2 WHERE k=1;  -- 等待T1完成

-- T1回滚后，T2继续执行
ROLLBACK;  -- T1回滚
-- T2更新成功执行

高级特性

等待队列跳跃：不冲突的事务可以跳过等待队列
子事务回滚：如果阻塞操作来自子事务且被回滚，等待事务可以继续
分布式死锁检测：通过enable_deadlock_detection=true启用

死锁检测示例

-- 事务T1更新行1
BEGIN;
UPDATE test SET v=2 WHERE k=1;

-- 事务T2更新行2
BEGIN;
UPDATE test SET v=4 WHERE k=2;

-- T1尝试更新行2(等待T2)
UPDATE test SET v=6 WHERE k=2;  -- 等待

-- T2尝试更新行1(形成死锁)
UPDATE test SET v=6 WHERE k=1;  -- 检测到死锁，T2被中止