没有进程显著使用内存时内存爆炸的故障排查

故障描述

得到以下用户反馈

  1. 进程被莫名其妙kill
  2. 远端登陆受阻

第一时间认为是内存爆炸。使用htop检查,果然发现MEMSWAP均已经99%使用

疑难点

htop视角下所有进程的%MEM都是0,因此不知道内存泄漏发生在何处

排查流程

  1. 检查僵尸进程,无
  2. 检查内核状态,是否有进程卡死在内核里。使用slabtop 检查,发现是anon_vma_chain占用大量内存,联想到fork bomb,即出现了大量使用微小内存的进程
  3. 使用htop验证猜想。由于SWAP也满,因此对进程依据SWAP降序排列,发现有一名用户大量创建了较高SWAPRESpython进程,怀疑该用户的此行为造成此次事故
  4. 进一步验证猜想。使用ps -u xxx | grep -c "python" 检查该用户创建的python进程数,发现创建了将近78000个进程,问题原因定位完成

修复

通知该用户后使用pkill将所有python进程清除。使用htop验证清理效果,清理完成

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值