线上问题记录
文章平均质量分 77
线上问题记录
布吉岛的石头
后端开发,奔跑在架构师的道路上
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
一次线上CPU和内存占用过高分析
记录一次系统运行两周后,监控系统频繁发送CPU占比过高,具体分析和后续跟进;10服务分配了10G内存,实际使用已经14G了,明显超出配置内存,继续分析。这个主要还是要通过排查代码来处理,后续分析具体dump结合着来进行整改。运行了较多的三方库和本地依赖,存在依赖重复问题,通过增加内存参数限制。# 查看 Java 应用名称(若通过 jvm 启动)服务中存在大量的反射,字符串拼接,并发不设置大小,# 查看进程启动命令和路径。首先登录机器查看具体信息。继续查看进程的使用情况。原创 2025-02-25 15:15:43 · 630 阅读 · 0 评论 -
一次线上事故排查
然后再根据日志数据的取查看数据库,实际菜单数据只有不到一千条,日志输出的获取i12的行数数十万行,可以确定是在获取菜单这里形成死循环了,再次增加日志输出这里获取菜单的数据,根据日志输出排查数据库,找到异常数据:第一级菜单的父级菜单应该是null,数据库的最新值是一个四级菜单,修改异常数据,等待数据库缓存刷新,再次触发操作,操作正常,服务正常。打印服务的主线程的Pid的栈信息,子进程的栈信息输出会有问题,输出的信息没有参考价值。首先登录对应系统的机器,top查看机器信息,显示当前cpu已经到了800%原创 2023-03-08 17:47:30 · 1561 阅读 · 0 评论
分享