该报错 是: 内核软死锁(soft lockup)
-
名词释义:
soft lockup就是说,这个bug没有让系统彻底死机,但是若干个进程(或者kernel thread)被锁死在了某个状态(一般在内核区域),很多情况下这个是由于内核锁的使用的问题。 -
通常由以下原因引发:
CPU资源不足或超负荷: 长时间高负载导致CPU无法响应中断或调度器心跳信号12。
内核任务阻塞或死循环:某进程在内核态长时间占用CPU且未释放资源。
虚拟机配置问题: vCPU分配超过物理CPU核数,或虚拟机资源(CPU/内存)受限。
硬件或驱动异常: 如电源不稳、超频、网卡驱动Bug等。 -
处理办法:
①cpu锁死,系统不能用的情况下,重启即可。
②如果确认不是软件或者程序问题的情况,处理办法:
增加watchdog等待时长(系统默认是10)
sudo sh -c "echo 30 >/proc/sys/kernel/watchdog_thresh"
临时生效
sudo sysctl -w kernel.watchdog_thresh=30
若想长期使该参数生效:
sudo vi /etc/sysctl.conf
添加:
kernel.watchdog_thresh=30
保存后执行:
sudo sysctl -p