配置Linux服务器NMI Watchdog

本文介绍如何配置Linux系统的NMI Watchdog,并通过触发panic来定位服务器挂死问题。详细步骤包括:检查NMI Watchdog状态,手动开启watchdog,监控interrupts变化,启用SysRq键进行panic触发,以及利用产生的core文件进行问题定位。

# 查看nmi watchdog状态,期望为1

sysctl kernel.nmi_watchdog

kernel.nmi_watchdog = 1

# 如果没有打开,则需要执行命令打开watchdog

sysctl  -w kernel.nmi_watchdog=1

# 配置好后,检查interrupts次数,打开watchdog之后,interrupts数值会增长

grep NMI /proc/interrupts

NMI: 824 869 588 603 489 207 344 154 163 59 439 198 1399 1180 341 684 297 166 263 100 104 99 72 83 Non-maskable interrupts

# 打开sysrq 键,允许手工trigger panic

echo "1" > /proc/sys/kernel/sysrq

# 当服务器挂死时, Trigger Panic, 使用IPMI按组合键, SysRq是PrintScreen键

Ctrl + Alt + SysRq + C

 

一旦触发panic,服务器重启之后,将可以在/var/crash下看到core文件,继续定位问题。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值