现场环境是Oracle的数据库集群,部署了xxx.xxx.xxx.102,xxx.xxx.xxx.104,xxx.xxx.xxx.106,xxx.xxx.xxx.108,xxx.xxx.xxx.109共五个节点,每次出现死锁的时候,就要登录每个节点去查询死锁,然后逐条的去解锁。
1、查询集群下,所有节点的死锁:
--Oracle数据库查询死锁,
select sess.sid,
sess.serial#,
lo.oracle_username,
lo.os_user_name,
ao.object_name,
'alter system kill session '''||sess.sid||','||sess.serial#||'''; ' as a,
lo.locked_mode
-- gv$locked_object gv$session 这两个表加上g,查询的是所有节点下的死锁
from gv$locked_object lo, dba_objects ao, gv$session sess
where ao.object_id = lo.object_id
and lo.session_id = sess.sid
--指定表名
and ao.object_name = 'TA_SP_APPROVE_INFO'
--指定用户名
and lo.oracle_username = 'HNCS_APPROVE'
注意:
1、'alter system kill session '''||sess.sid||','||sess.serial#||'''; ' as a, 这一句是把查询到的死锁用解除死锁的语句拼接起来,查询出来之后,我们就只要复制这一列,执行即可解除死锁;
2、from gv$locked_object lo, dba_objects ao, gv$session sess from后面的gv$locked_object和gv$session中的g,表示的查询全局(也就是集群下所有的节点);这样的话,当我们把第一点说的列复制出来,解除死锁的时候,很多解除死锁的语句都会报:丢失或无效的会话ID。因为很多的死锁不是在本节点,所以在本节点无法解除死锁。
3、可以指定用户名和表名作为查询条件,只查询对应的死锁。
查询得到的结果示例如下:
alter system kill session '7580,64754';
alter system kill session '7580,59542';
2、查询集群下,当前节点的死锁:
--Oracle数据库查询死锁,
select sess.sid,
sess.serial#,
lo.oracle_username,
lo.os_user_name,
ao.object_name,
'alter system kill session '''||sess.sid||','||sess.serial#||'''; ' as a,
lo.locked_mode
-- v$locked_object v$session 这两个表没有加上g,查询的是当前节点下的死锁
from v$locked_object lo, dba_objects ao, v$session sess
where ao.object_id = lo.object_id
and lo.session_id = sess.sid
--指定表名
and ao.object_name = 'TA_SP_APPROVE_INFO'
--指定用户名
and lo.oracle_username = 'HNCS_APPROVE'
注意:
from v$locked_object lo, dba_objects ao, v$session sess 这一句中的 v$locked_object 和 v$session ,他们的$前面只有v,并没有g,说明只是查询当前节点。这样查询出来的死锁基本上都是在本节点上的,直接复制就能解除死锁。所以,如果有多个节点,就要在每个节点上都执行同样的操作,才能解除所有的死锁。