本帖最后由 running_life 于 2017-5-15 11:05 编辑
环境:rhel6.3 11.2.0.4.4 rac
情况描述:接到预警信息,session中有55个log file sync,查询blocker为lgwr,但是lgwr进程本身是空闲等待,且执行其他新的dml语句,commit正常。
另外,在半个小时前重启过该库的adg,同步模式是async的。
现在已经堵塞了很久了,只是因为新的commit没有被堵塞,所以没造成事故。但是这个情况怎么分析处理呢,简单的kill么,但是没找到原因。。。刚我又查了一次,这次堵塞没有了。。。大概堵了一个小时左右,就自动消失了。
上传了一个session的进程信息dump和lgwr进程的dump
不怎么看得懂,请路过的朋友,大神指点
=========================================================================================================
今天又发现这个问题了,故障时间段大约为7:16---8:06这次监控数据更完整,部署了oswbb监控15面收集一次数据,部署了dstat监控每秒收集一次性能数据
通过oswbb的oswprvtnet查看故障时段内私网性能波动不大,tracerote都是1ms一下,一般是0.17ms,高的时候有0.78ms左右
查看oswps,故障时刻cpu使用不高,lgwr进程cpu使用率也不高
通过dstat数据查看了故障时刻的网络,磁盘,cpu等使用情况,这些资源的使用率都非常低,网络最高也就15MB 左右,磁盘也是20MB左右,cpu为5%左右
查看lgwr日志,发现7:50左右有警告Warning: log write broadcast wait time 6966ms (SCN 0xb48.801b20a9)
其实我有点怀疑是post与poll切换导致的,但是在

在Oracle 11.2.0.4.4 RAC环境中,出现session的commit被LGWR进程阻塞的情况,但LGWR自身处于空闲等待状态。半小时前曾重启ADG库,同步模式为async。问题出现后,新的commit操作仍能正常进行,未引发事故。经过一段时间,阻塞问题自行消失。日志显示7:50左右有6966ms的log write broadcast wait time警告。疑与post/poll切换有关,但未找到明确原因。建议进一步分析LGWR日志和系统资源使用情况。
最低0.47元/天 解锁文章
1229

被折叠的 条评论
为什么被折叠?



