【昇腾故障案例-安装部署】Atlas 800-9000 EulerOS 2.8系统,fio压测时OS发生softlockup重启

解决软锁定问题:压力测试导致的softlockup分析与对策
在进行scend_dmi工具的压力测试中,25小时后系统出现softlockup,原因是fio对磁盘的压力超过其处理极限。解决方案包括延长softlockup触发时间和关闭softlockuppanic设置,以防止系统重启。这可以通过临时或永久修改系统配置来实现,并通过特定命令验证设置是否生效。

问题现象描述

硬件配置:内存(24*32G)网卡(4*100G)系统盘(PM883 480G)数据盘(1*PM883 480G, 7*960G SAS, 1*3.84T SAS)

问题现象:scend_dmi 工具同时对 NPU、硬盘、网卡、CPU 和内存进行压力测试,压测 25 小时后 OS 发生 soft lockup,打印日志如下:

关键过程、根本原因分析

具体请参见结论、解决方案及效果。

结论、解决方案及效果

结论:fio 压力超过磁盘处理能力极限,导致 io 处理流程较长,最终发生 softlockup

解决方案:

针对 fio 压测场景(其他场景保持默认或按其他说明配置)可执行如下措施:

延长 softlockup 触发时间和关闭 softlockup panic 设置(即发生 softlockup 时,系统不重启)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值