记一次线上OOM事故

OOM 问题

linux内核有个机制叫OOM killer(Out-Of-Memory killer),当系统需要申请内存却申请不到时,OOM killer会检查当前进程中占用内存最大者,将其杀掉,腾出内存保障系统正常运行。
一般而言,一个应用的内存逐渐增加,肯定是不正常的,这个时候可认为该应用存在内存泄漏,当系统内存被占用到一定的时候,将会触发OOM,此时系统将会找一个最合适的进程杀掉,以释放内存。

原因:
大query带来内存上涨,大量连表查询加载数据到内存中,进行数据筛选,导致内存上涨,触发linux oom 机制 ,杀掉mysql ,同时表数量较多导致innodb数据字典内存占用多
内部解决思路:
1.先进行数据库配置升级,项目1库升级到16c128G配置,项目2库升级到8c32g。
2.持续监测内存,发现内存占用基本60%左右。
3.进行慢sql,连表查询sql优化。
4.计划迁移mysql 到polardb。
5.排查linux日志,定位触发oom的时候mysql 占用内存大小。以及附近sql。
6.设置mysql 禁用oom机制,将mysql评分降为最低,oom时候 只会杀掉评分最高的进程。
7.降低mysql Buffer Pool值,因为阿里云rds 默认此值占用过高(最高65%内存),降低缓存区大小,可以预留一部分内存作为抵抗不可控风险使用。
8.彻底关闭linux oom机制。 sysctl -w vm.panic_on_oom=1
实际执行中遇到的问题:

  • 由于阿里云RDS只支持对数据库的使用,不支持对系统层面的一些配置。所以上述第6条、上述第8条,不可用
  • 由于阿里云RDS配置Buffer Pool
    需要重启mysql,项目量级较大,重启耗时半小时以上,所以上述第7条,不可用,有动态调整缓存区大小方案,但是性能抖动很激烈,花费时间更久,不推荐。
  • 由于阿里云RDS不支持查询linux日志,oom日志暂未获得,阿里方给了一部分oom附近sql。进行参考优化。
  • 由于迁移polardb对现在数据库性能影响较大,迁移时间不可控,迁移过程中增量数据迁移方案未确定,目前正在调研中。
### 关于线OOM (Out Of Memory) 案例分析及解决方案 #### 线上环境中的OOM问题概述 在线上环境中,当应用程序遭遇 Out of Memory (OOM) 错误时,通常会调用 `Thread::ThrowOutOfMemoryError` 函数并传递描述错误详情的消息参数 msg[^1]。这类异常不仅影响用户体验还可能导致服务中断。 #### 实际案例解析 假设某 Android 应用程序频繁出现崩溃现象,在日志中发现大量由系统抛出的 OOM 异常录。进一步调查表明该应用存在不合理加载图片资源的情况——即一次性尝试加载过多高分辨率图像至内存中而未做适当优化处理。这使得虚拟机无法分配足够的连续空间来满足请求从而触发了 OOM 错误。 针对上述情况采取如下措施: - **减少单次加载量**:限制每次仅读取一定数量的小尺寸缩略图而非原始大小; - **启用缓存机制**:对于已加载过的图片实施 LRU 缓存策略以便重复访问时不需重新获取; - **异步操作**:采用后台线程完成耗时较长的任务如网络请求或磁盘IO动作防止阻塞主线程造成响应延迟甚至卡死状况的发生。 经过以上改进之后有效地缓解了因图片加载不当所引发的一系列性能瓶颈问题显著降低了 OOM 发生概率提升了整体稳定性表现。 #### 工具辅助诊断流程 面对较大规模的应用程序,手动排查可能存在效率低下且难以全面覆盖所有潜在风险点的问题。此时可以借助专业的调试工具来进行更深入细致地剖析工作。例如 JVisualVM 是一款功能强大的 Java 应用性能监控平台能够帮助开发者快速定位到具体哪一部分代码消耗了大量的堆内存量进而指导后续修复方向的选择不过需要注意的是如果待检测的数据集非常庞大则建议预先调整好 JVM 的启动参数以确保有足够的可用 RAM 来支持整个分析过程顺利开展[^2]。 另外还可以考虑使用其他专门用于 heap dump 文件解析的专业软件比如 Eclipse MAT 或 Visual VM 自身集成的功能模块等它们各自具备独特的优势可以根据实际需求灵活选用最合适的选项。 #### 内存泄漏预防指南 为了避免未来再次遇到类似的挑战可以从以下几个方面着手加强防护力度: - 定期审查现有架构设计是否存在不必要的对象持有关系特别是静态成员变量以及监听器注册注销逻辑是否严谨无遗漏之处; - 对第三方库保持警惕谨慎引入未经充分测试验证的新依赖项以免埋下隐患; - 培养良好的编程习惯遵循最佳实践编写易于维护扩展性强的高质量源码。 ```java // 示例代码展示如何安全释放Bitmap资源 public void recycleBitmap(Bitmap bitmap){ if(bitmap != null && !bitmap.isRecycled()){ bitmap.recycle(); System.gc(); // 提示垃圾回收器尽快清理不再使用的对象 } } ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值