环境:
最近处理一例 ORACLE RAC 12.2.0.1 的故障。该 RAC 为二节点集群,运行在 CentOS Linux 7 操作系统上。
现象:
规律性出现短时间的 CPU 负载飙升,达到到100%。
通过top命令监控可见几个 gdb 进程在占用 CPU 资源:
解决:
经查,应该是 Osysmond 启动了diagsnap.pl,diagsnap运行在调试模式。
diagsnap 由 ORACLE 12.2 Autonomous Health Framework 用于在集群问题中创建诊断信息。
Cluster Health Monitor 可以配置成不收集这类信息。命令如下:
~$ oclumon manage -diable diagsnap