现象:服务器突然失去响应,CRT断开连接不上,大概5分钟后又正常了,查看alert.log发现:
ORA-27300:OS system dependent operation:fork failed with status:12
ORA-27301:OS failure message:not enough space
ORA-27302:failure occurred at :skgpspawn3
查看系统空间正常,查看系统日志:
description
software program abnormally terminated
probable causes
system running out of paging space
以上可以看出: 确定是oracle进程占用了大量的paging space,最后导致数据库反复终止,最终系统资源耗尽,系统异常终止,进程释放 系统正常恢复。 在oracle系统中,最有可能大量占用paging sapce 的源头就是pga,说白了就是pga大量被占用,查看库pga设置只有1GB。考虑到有可能数据库的某个server processes 的占用pga超过规定的1GB,那么这个时候就会大量占用paging space。 pga 大量被占用最有可能的就是客户端排序或者是session cursor 返回大量的记录导致。 客户端排序可能性不大,最有可能的就是session cursor返回了大量的记录。 可以通过AWR报告,来获取论证信息,关注pga使用趋势和执行异常的sql。
最后发现在使用批量处理cursor的时候,循环内部自定义数组的下标没有重置,导致数组无限扩张,最终大量占用pga,撑爆paging space。
总结: 1、处理session cursor,注意使用循环批量处理, 避免逐条处理; 避免一次性返回大量记录; 处理完成注意释放cursor 各项自定义变量重置,避免无限扩张和内存溢出。