因为内存溢出造成系统宕机是一个头疼的问题,那么怎么确定问题源呢
直接翻找相关系统日志,搜索 GC overhead limit,一般内存溢出报错上面的SQL就是问题的源头SQL

如果硬要找说服力,可以下载相关内存溢出生成的dump文件用MAT(MemoryAnalyzerTool)工具分析(这个工具应该属于老掉牙的东西,凑合用)
我们可以看到MAT工具自动分析后会给你列出问题嫌疑的内容:局部变量保有量达到753M,好大一对象,JVM消化不动撂挑子了。

查看详细内容会发现一些似曾相识的内容,eg:sendtime在前面的异常日志里出现过,多翻几个node会发现完全与日志里的SQL匹配,此时你就可以拿着这个SQL甩到开发人脸上BB一番,嗯这样做容易没朋友慎用。
补充:RequestParam目录下可以看到请求参数,更容易确认问题来源

当遭遇因内存溢出导致的系统宕机时,可以通过检查系统日志寻找包含'GCOverheadLimit'的SQL作为问题线索。使用MAT(MemoryAnalyzerTool)工具分析内存dump文件,可以揭示占用大量内存的对象和可能的源头SQL。MAT工具会提供详细的分析报告,比如局部变量持有大量内存,结合日志和请求参数,能更准确地定位问题。找到问题SQL后,可以与开发团队进行沟通解决,但要注意沟通方式以免影响团队关系。
1117

被折叠的 条评论
为什么被折叠?



