
好的,这是一个非常深入且专业的话题。我们将详细探讨 Oracle 的行级依赖跟踪(Row-Level Dependency Tracking,RLDT)机制,这是一种用于维护数据读一致性和并发控制的精细化管理技术。
第一部分:官方技术详解
一、核心概念与作用
1. 什么是行级依赖跟踪?
行级依赖跟踪是 Oracle 多版本读一致性(Multi-Version Read Consistency, MVCC)模型的一个底层增强机制。它超越了基于数据块(Block)的粒度,允许数据库更精确地跟踪和记录单个数据行的修改历史。其核心目的是为了判断一个先前读取的数据行在后续操作中是否已被其他会话修改。
2. 核心作用
- 精细化的读一致性判断:在分布式查询、物化视图刷新或应用程序需要验证读后数据是否变化等场景下,提供比块级更精确的“行级”变更检测,避免虚假的“快照过旧”(
ORA-01555)或不必要的块级回滚。 - 减少虚假冲突:在逻辑备库(Logical Standby)或某些复制环境中,避免因为同一数据块内其他无关行的修改,而导致本行数据应用时产生不必要的冲突和等待。
- 支持精细锁定:为
SELECT ... FOR UPDATE等语句提供更细粒度的锁信息,优化并发性能。
二、内部原理与底层机制
要理解 RLDT,必须首先回顾其基础:读一致性和 SCN(System Change Number)。
1. 基础:读一致性与 SCN
- 当一个查询开始,它会被赋予一个查询开始时的 SCN(
QUERY SCN)。 - 查询过程中,如果需要的数据块在当前版本(当前时间点)的 SCN 高于查询 SCN,Oracle 必须从回滚段(Undo Segment) 中构造一个“读一致”的版本,该版本的 SCN 必须等于或早于查询 SCN。
- 传统的机制是在数据块头记录一个 ITL Entry( Interested Transaction List),其中包含了最近修改该数据块的事务的 SCN 和 Undo 地址。
2. 行级依赖跟踪的增强
传统的 ITL 是块级的。如果一个块被修改,即使只改了一行,整个块的 ITL 也会更新。RLDT 将这种跟踪细化到了行级。
其核心是在数据行本身存储额外的信息。当一个启用了 RLDT 的表中的行被修改时,数据库会在该行中记录(或更新)一些关键信息:
ORA_ROWSCN伪列:这是最直观的体现。你可以通过SELECT ORA_ROWSCN, ... FROM table ...查询每一行最近的修改 SCN。- 默认行为(块级):如果表创建时未指定
ROWDEPENDENCIES,则ORA_ROWSCN实际上存储在数据块头中,该块内所有行的ORA_ROWSCN值相同,即该块最后一次提交的 SCN。 - 行级依赖跟踪(行级):如果表创建时指定了
ROWDEPENDENCIES,则每个数据行都会分配 6 字节的额外空间来独立存储:- 该行最近一次修改提交时的 SCN。
- 一个用于跟踪依赖的标识符。
- 默认行为(块级):如果表创建时未指定
3. 工作机制详解
假设我们有一个启用了行级依赖跟踪的表:
CREATE TABLE orders (
order_id NUMBER PRIMARY KEY,
amount NUMBER
) ROWDEPENDENCIES; -- 关键子句
场景:判断一行是否变化
-
会话 A 在 SCN 1000 时查询一行:
SELECT order_id, amount, ORA_ROWSCN FROM orders WHERE order_id = 123; -- 返回: ORDER_ID=123, AMOUNT=500, ORA_ROWSCN=500(假设该行上次提交的 SCN 是 500)。
-
会话 B 在 SCN 1005 时更新了这行并提交:
UPDATE orders SET amount = 600 WHERE order_id = 123; COMMIT; -- 假设提交时的SCN是1010 -
稍后,会话 A 想要验证它读到的数据是否还是最新的(一种乐观锁机制):
-- 应用程序保存了之前的ORA_ROWSCN=500 SELECT amount, ORA_ROWSCN INTO :new_amount, :new_ora_rowscn FROM orders WHERE order_id = 123 AND ORA_ROWSCN = 500; -- 如果行没变,ORA_ROWSCN应仍为500 IF SQL%NOTFOUND THEN -- 行已经被修改!因为找不到ORA_ROWSCN=500的行了。 -- 新的:new_ora_rowscn 会是 1010 END IF;在这个例子中,因为表启用了
ROWDEPENDENCIES,数据库可以精确地检查到order_id=123这一行的 SCN 已经从 500 变为 1010。如果没有启用,它会去检查整个数据块的 SCN,如果该块有其他行被修改,也会导致误判。
4. 管理机制
- 启用:只能在表创建时使用
ROWDEPENDENCIES子句启用。启用后,每行会增加 6 字节的存储开销。CREATE TABLE my_table (...) ROWDEPENDENCIES; - 禁用:默认行为,即使用
NOROWDEPENDENCIES(也是默认值)。行依赖信息存储在块头。 - 修改:无法通过
ALTER TABLE直接在ROWDEPENDENCIES和NOROWDEPENDENCIES之间切换。必须移动数据:
注意:ALTER TABLE my_table MOVE ROWDEPENDENCIES; -- 启用 ALTER TABLE my_table MOVE NOROWDEPENDENCIES; -- 禁用MOVE操作会重建表,并使索引失效,需要在线重定义或安排停机时间。
第二部分:场景、争用、排查与解决
行级依赖跟踪本身是为了减少某些类型的争用而设计的,但它会引入额外的存储开销。其相关的性能问题更多是读一致性机制本身的共性问题。
三、性能影响与排查
1. 场景:ORA-01555: snapshot too old
-
原理:这是读一致性的核心问题。当查询需要从回滚段构造旧版本数据时,如果所需的 Undo 信息已经被覆盖(由于回滚段空间循环使用),就会抛出此错误。
-
RLDT 的影响:
- 正面:在非 RLDT 表中,如果查询需要读一个块,只要该块中任何一行的旧版本 Undo 信息被覆盖,整个查询都可能失败。
- 正面:在 RLDT 表中,判断更精确。如果只是同一块内其他行的 Undo 信息被覆盖,但你关心的那一行的 Undo 信息还在,查询可以继续。它减少了“被邻居连坐”的可能性。
- 负面:RLDT 并不能消除
ORA-01555。如果你关心的那一行本身的 Undo 信息被覆盖,错误依然会发生。
-
排查:
- 检查错误信息,确定是哪个查询引发的。
- 检查回滚段的大小和保留策略(
UNDO_RETENTION,UNDO_TABLESPACE)。 - 使用 AWR 报告,观察
Undo Segment Stats部分中的"ORA-01555"计数和"Undo Records Applied"等统计信息。
-
解决:
- 增加
UNDO_RETENTION参数。 - 扩大撤销表空间的大小。
- 优化长时间运行的查询,减少其需要“回溯”的时间窗口。
- 增加
2. 场景:buffer busy wait / read by other session
-
原理:这些等待事件发生在多个会话想要以不兼容的模式访问同一个数据块时(例如,一个要读,一个要修改)。
-
RLDT 的影响:
- 理论上可能加剧:因为每行多了 6 字节,一个块能容纳的行数变少,可能会轻微增加访问相同数据所需的块数,但对争用概率影响微乎其微。
- RLDT 的目标是减少逻辑上的冲突,而非物理块争用。
-
排查与解决:这些等待的解决与传统方法一致:优化索引减少全表扫描、使用更小的块大小、使用 ASSM 表空间等,与 RLDT 关系不大。
四、常用查询与管理 SQL
-
检查表是否启用了行级依赖跟踪:
SELECT table_name, dependencies FROM dba_tables WHERE table_name = 'ORDERS'; -- `DEPENDENCIES` 列值为 'ENABLED' 或 'DISABLED' -
查询行的 SCN 信息:
SELECT rowid, order_id, amount, ORA_ROWSCN FROM orders WHERE order_id = 123; -- ORA_ROWSCN 显示该行最近的提交SCN -
监控 Undo 和一致性相关统计:
-- 检查长时间运行的查询及其撤销使用量 SELECT sid, serial#, sql_id, status, to_char(start_time, 'yyyy-mm-dd hh24:mi:ss') start_time, used_ublk, used_urec FROM v$transaction ORDER BY start_time; -- 检查AWR中的Undo和一致性错误 -- 需要查看AWR报告的 "Undo Segment Stats" 和 "Load Profile" 部分 -
模拟和测试乐观锁:
-- 会话1: 读取数据和ORA_ROWSCN DECLARE v_amt orders.amount%TYPE; v_scn NUMBER; BEGIN SELECT amount, ORA_ROWSCN INTO v_amt, v_scn FROM orders WHERE order_id = 123; -- 应用程序保存 v_amt 和 v_scn -- ... 一些处理逻辑 ... -- 尝试更新,验证数据未变 UPDATE orders SET amount = :new_value WHERE order_id = 123 AND ORA_ROWSCN = v_scn; -- 关键:用保存的SCN作为验证条件 IF SQL%ROWCOUNT = 0 THEN -- 更新了0行,说明在"处理逻辑"期间,该行已被他人修改 RAISE_APPLICATION_ERROR(-20001, 'Optimistic lock failed: data was changed by another user.'); END IF; COMMIT; END; /
第三部分:通俗易懂的解释
想象一下你和一个团队在共用一个共享的电子表格来跟踪项目任务。
-
没有行级跟踪(传统块级ITL):这个表格有一个“最后保存时间”,显示的是整个文件最后一次被保存的时间。
- 问题:你想知道你负责的“任务A”是否被修改了。你只能看整个文件的“最后保存时间”。如果你的同事修改了“任务B”并保存了文件,整个文件的“最后保存时间”也会更新。这时你无法判断是“任务B”变了还是你的“任务A”变了,你可能会产生误判。
-
启用行级依赖跟踪(RLDT):现在,电子表格的每一行都有自己的“最后修改时间”。
- 优势:你可以直接查看“任务A”这一行的“最后修改时间”。如果你的同事只修改了“任务B”并保存,只有“任务B”那行的修改时间会更新,“任务A”的修改时间保持不变。你可以精确地知道你的任务没有被触碰。
- 代价:表格文件会变大一点,因为每一行都要额外存储一个时间戳(这对应了数据库中每行 6 字节的开销)。
-
ORA-01555错误:想象电子表格有“撤销”功能,但只能记录最后100次操作。你打开了一个很大的表格开始工作(开始一个长查询)。在此期间,你的同事们疯狂地工作了200次,导致最早期的100次操作记录从“撤销”历史中被挤掉了。当你试图查看表格中某些早期数据时,系统无法再为你还原它最初的样子了,就会提示你“快照太旧了”。- RLDT 的作用:它不能增加“撤销”历史的大小。但它能让你更精确地知道到底是哪一行的历史记录被覆盖了。如果被覆盖的都是你不关心的行,你的工作还可以继续。只有当你关心的那行历史被覆盖时,你的工作才会被迫中断。
总结:
Oracle 的行级依赖跟踪是一种用存储空间换取数据变更判断精度的机制。它主要惠及两类场景:
- 需要实现高效乐观锁的应用程序,可以更可靠地检测数据冲突。
- 减少在逻辑备库或复杂查询中因“块级”粗粒度判断而导致的虚假失败。
对于大多数常见的 OLTP 应用,默认的块级管理已经足够。但在特定的高并发、高竞争、或需要精细化管理数据一致性的场景下,启用 ROWDEPENDENCIES 是一个值得考虑的优化手段。DBA 在决策时需要权衡其带来的存储开销和所能解决的业务痛点。
欢迎关注我的公众号《IT小Chen》

被折叠的 条评论
为什么被折叠?



