环境:
最近处理一例 ORACLE RAC 12.2.0.1 的故障。该 RAC 为二节点集群,运行在 CentOS Linux 7 操作系统上。
现象:
规律性出现短时间的 CPU 负载飙升,达到到100%。
通过top命令监控可见几个 gdb 进程在占用 CPU 资源:

解决:
经查,应该是 Osysmond 启动了diagsnap.pl,diagsnap运行在调试模式。
diagsnap 由 ORACLE 12.2 Autonomous Health Framework 用于在集群问题中创建诊断信息。
Cluster Health Monitor 可以配置成不收集这类信息。命令如下:
~$ oclumon manage -diable diagsnap
本文探讨了一例Oracle RAC12.2.0.1版本在CentOS Linux7环境下出现的CPU负载规律性飙升故障。故障表现为gdb进程占用大量CPU资源,经排查发现是由diagsnap.pl在调试模式下运行所致。diagsnap由Oracle12.2 Autonomous Health Framework使用,用于在集群问题中创建诊断信息。解决方案是禁用Cluster Health Monitor的diagsnap信息收集功能。
926

被折叠的 条评论
为什么被折叠?



