问题现象描述
硬件配置:内存(24*32G)网卡(4*100G)系统盘(PM883 480G)数据盘(1*PM883 480G, 7*960G SAS, 1*3.84T SAS)
问题现象:scend_dmi 工具同时对 NPU、硬盘、网卡、CPU 和内存进行压力测试,压测 25 小时后 OS 发生 soft lockup,打印日志如下:

关键过程、根本原因分析
具体请参见结论、解决方案及效果。
结论、解决方案及效果
结论:fio 压力超过磁盘处理能力极限,导致 io 处理流程较长,最终发生 softlockup
解决方案:
针对 fio 压测场景(其他场景保持默认或按其他说明配置)可执行如下措施:
延长 softlockup 触发时间和关闭 softlockup panic 设置(即发生 softlockup 时,系统不重启)。

在进行scend_dmi工具的压力测试中,25小时后系统出现softlockup,原因是fio对磁盘的压力超过其处理极限。解决方案包括延长softlockup触发时间和关闭softlockuppanic设置,以防止系统重启。这可以通过临时或永久修改系统配置来实现,并通过特定命令验证设置是否生效。
最低0.47元/天 解锁文章
744

被折叠的 条评论
为什么被折叠?



