Oracle-一次TX行锁堵塞事件

最新推荐文章于 2025-04-23 07:00:00 发布

牛牛的笔记

最新推荐文章于 2025-04-23 07:00:00 发布

阅读量1.4k

点赞数 24

文章标签： oracle 数据库 dba 运维问题分析

本文链接：https://blog.youkuaiyun.com/sinat_36757755/article/details/138503851

版权

问题背景：

接用户问题报障，应用服务出现大量会话堆积现象，数据库锁堵塞严重，需要协助进行问题定位和排除。

问题分析：

登录到数据库服务器上，首先查看一下数据库当前的等待事件情况，通过gv$session视图可以看到，当前会话存在大量的enq: TX - row lock contention行锁堵塞。

对应出现TX行锁堵塞情况，需要分析一下TX行锁的堵塞链情况，确认是否是同一个堵塞源还是多个不同的堵塞源，对于同一个堵塞源引发的TX行锁问题，需要重点去分析这个堵塞源的会话状态和操作行为是否存在问题，比如有没有在执行长时间拿锁的操作，语句的执行状态时间、会话的状态空闲还是活跃以及业务的事务执行逻辑。对于出现多条堵塞链和多个不同的堵塞源情况，通常是由于数据库的性能问题、表索引的设计问题、业务的事务逻辑问题导致，需要先分析整理堵塞链上的操作对象是否存在关联，业务的执行逻辑是否存在关系，再进一步分析堵塞产生的原因。

这里我们通过gv$session视图的blocking_session查询会话之间的堵塞链情况，可以看到会话的堵塞源最终都指向了节点一实例的SID:855会话。

select *
  from (select a.inst_id, a.sid, a.serial#,
               a.sql_id,
               a.event,
               a.status,
               connect_by_isleaf as isleaf,
               sys_connect_by_path(a.SID||'@'||a.inst_id, ' <- ') tree,
               level as tree_level
          from gv$session a
         start with a.blocking_session is not null
        connect by (a.sid||'@'||a.inst_id) = prior (a.blocking_session||'@'||a.blocking_instance))
 where isleaf = 1
 order by tree_level asc;

由于堵塞源都指向855会话，因此这里我们只取其中一条堵塞链<- 69@1 <- 100@1 <- 368@1 <- 855@1进行分析。

查看堵塞源SID 855的会话执行情况，可以看到会话为LGWR进程，状态为ACTIVE，等待事件为rdbms ipc message。LGWR引发堵塞，很有可能是LGWR进程无法及时完成日志写工作。