收到报警, load负载高于100
登机检查,提示无法远程ssh登录。
使用kvm查看界面,有一些stuck
top查看,提示内存无法分配
擦,这个时候该如何做呢?
free -m 看看内存如何,剩余1.4GB,但是已经提示无法分配内存了,不知道为啥?
ps aux实际上也是无法使用的
这个时候,不是暴了一些pid么, kill 20630(干掉mysql)
现在能想到的,赶紧让系统多保留一些内存,
ecat /proc/sys/vm/min_free_bytes
echo 2048000 > /proc/sys/vm/min_free_bytes
实际上,最终swap内存还是会使用,已经代表内存不够用了。
哎,可怜了这台8核心64GB需要跑十多个java进程的机器了。
另外,如果我们没有kvm,该如何是好呢?也许保留多一点点free内存会对我们有好处,或许就是等,等到程序oom的时候气球就爆了。
本文记录了一次服务器负载异常升高的故障排查过程。面对load负载超过100且无法远程登录的问题,通过KVM发现系统界面卡顿,并出现了内存分配失败的情况。文中详细介绍了采取的一系列紧急措施,包括终止占用大量资源的进程、调整系统内核参数以增加可用内存等。
713

被折叠的 条评论
为什么被折叠?



