
现网问题
文章平均质量分 80
以现网问题为史,避免被同一个石头绊倒两次
爱琴孩
扫盲+科普+解惑,愿天下程序员每天少掉头发
展开
-
记一次现网服务FGC告警
起因是运维发现现网一个服务触发了FGC频率监控告警,具体告警信息如下遇到这种问题,首先考虑就可能是发生内存泄漏了,或者存在大对象,导致无法申请新内存。运维在把触发告警的节点重启之间,保存了dump信息,下面来看看具体的内存快照信息。原创 2025-02-09 13:58:33 · 465 阅读 · 0 评论 -
记一次tomcat版本升级导致的现网问题
通过这件事,总结如下遇到现网问题不要慌,冷静思考问题本质,不要仅关注业务日志,业务日志排查没有头绪,tomcat和Nginx的access.log也是很有用的,还有网关日志,根据这些日志排查具体请求在什么位置中断了。这次上线的一批服务都是做一些安全漏洞修复,没有业务需求,所以测试在功能验证中可能有遗漏,导致了这次现网故障,所以还是得谨慎点。原创 2023-07-02 17:39:37 · 663 阅读 · 0 评论 -
通过一次线上问题,讲下Ribbon重试机制
前段时间,产品经理在线上验证产品功能的时候,发现某个功能不符合需求预期,后来测试验证发现是服务端的一个接口大概率偶现超时,前端做了兜底处理,所以对线上用户么有太大影响。原创 2023-07-29 16:20:51 · 1117 阅读 · 0 评论 -
如何通过MAT排查生产环境服务内存溢出
MAT是Memory Analyzer的简称,它是一款功能强大的Java堆内存分析器。可以用于查找内存泄露以及查看内存消耗情况。MAT是基于Eclipse开发的,是一款免费的性能分析工具。读者可以在下载并使用MAT。如上图所示,可以点击大对象,查找对应的线程详情 还有表格形式当然,这里查看Java层面的应用线程,对于虚拟机的系统线程是无法显示的。通过线程的堆栈,还可以查看局部变量的信息。原创 2023-08-19 12:38:10 · 1094 阅读 · 0 评论