频发：故障排除之又见 ORA-4031丨云和恩墨技术通讯

最新推荐文章于 2024-08-14 11:49:48 发布

原创

最新推荐文章于 2024-08-14 11:49:48 发布 · 737 阅读

0 ·

CC 4.0 BY-SA版权

本文详细分析了一起由ORA-4031错误导致的数据库异常宕机案例，该错误发生在shared pool的第0个duration上。通过检查alert日志，发现大量此类报错，最终解决方案是禁用shared pool的duration，并重启数据库。此案例对于理解Oracle内存管理及故障排查具有重要参考价值。

微信图片_20191202094725.jpg

亲爱的读者朋友：

为了及时共享行业案例，通知共性问题，达成共享和提前预防，我们整理和编辑了《云和恩墨技术通讯》，通过对过去一段时间的知识回顾，故障归纳，以期提供有价值的信息供大家参考。同时，我们也希望能够将热点事件、新的产品特性及其他有价值的信息聚集起来，为您提供具有前瞻性的支持信息，保持对于当前最新的数据库新闻和事件的了解，其中包括重要数据库产品发布、警报、更新、新版本、补丁等。

本期目录：

新闻：2019年11月数据库流行度排行

经验：Oracle RAC跨节点访问数据块，节点长事务加剧gc等待

经验：IBM MQ通道连接数达到最大故障分析

问题：子游标过多导致数据库HANG

频发：再谈Library Cache Lock

频发：故障排除之又见ORA-4031

警示：强制关闭OGG进程触发bug致abended

公告：首届墨天轮年度十大突出贡献人物评选活动

云和恩墨技术通讯集锦：https://www.modb.pro/doc/topic/5927

部分精选-频发：故障排除之又见 ORA-4031 作者：候静远

当遇到ORA-4031错误时，你会不会内心一紧。Oracle进程在向SGA申请内存时，如果申请失败，则会抛出这个错误，大部分情况下是在向SGA中的 shared pool申请内存时失败。严重情况下，可能导致数据库出现异常崩溃。本文分享客户近期碰到的一起由于ORA-4031问题导致数据库异常宕机的案例，供大家参考。

问题描述

2019年9月4日凌晨3点左右，接到监控系统告警：数据库出现异常，无法连接。登陆到数据库1节点查看后台alert日志发现有大量ORA-04031报错，2节点有少量报错。为了尽快恢复业务，尝试直接重启1节点数据库，重启完成之后恢复正常。

问题分析

1. 节点后台对应alert日志：

Wed Sep 04 03:57:50 2019

Errors in file /u01/app/oracle/diag/rdbms/xxxxx/xxxxx/trace/xxxxx_smon_29747.trc:

ORA-00604: error occurred at recursive SQL level 1

ORA-04031: unable to allocate 3896 bytes of shared memory ("shared pool","update sys.col_usage$ set ...","sga heap(2,0)","kglsim object batch")

Wed Sep 04 03:58:10 2019

Errors in file /u01/app/oracle/diag/rdbms/xxxxx/xxxxx/trace/xxxxx_smon_29747.trc:

ORA-00604: error occurred at recursive SQL level 1

ORA-04031: unable to allocate 3896 bytes of shared memory ("shared pool","update sys.col_usage$ set ...","sga heap(1,0)","kglsim object batch")

Wed Sep 04 03:58:26 2019

Errors in file /u01/app/oracle/diag/rdbms/xxxxx/xxxxx/trace/xxxxx_smon_29747.trc:

ORA-00604: error occurred at recursive SQL level 1

ORA-04031: unable to allocate 3896 bytes of shared memory ("shared pool","update sys.col_usage$ set ...","sga heap(7,0)","kglsim object batch")

W