linux内存条排查

本文介绍了一种通过服务器日志信息来定位具体故障内存条的方法。通过解析内核日志中的错误信息并结合dmidecode命令获取的内存布局,确定了故障内存的具体位置。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

已发现2个内存错误,应用名称(kernel:),日志内容(hangzhou-jishuan-DDS0248 kernel: sbridge: HANDLING MCE MEMORY ERROR hangzhou-jishuan-DDS0248 kernel: EDAC MC0: CE row 5, channel 0, label CPU_SrcID#0_Channel#3_DIMM#1:1 Unknown error(s): memory scrubbing on FATAL area : cpu=0 Err=0008:00c1 (ch=1), addr = 0x1c9bea000 = socket=0, Channel=3(mask=8), rank=5)
 
如何判断是第几条内存?
 
获取服务器内存信息(此信息可以在报修的时候提供给硬件厂商工程师,记得告诉他们仅供参考)。
 
shell命令:dmidecode | grep -A 9 -B 6 DIMM | grep Bank
 
        Bank Locator: BRANCH 0 CHANNEL 1 DIMM 0
        Bank Locator: BRANCH 0 CHANNEL 1 DIMM 1
        Bank Locator: BRANCH 0 CHANNEL 2 DIMM 0
        Bank Locator: BRANCH 0 CHANNEL 2 DIMM 1
        Bank Locator: BRANCH 0 CHANNEL 3 DIMM 0
        Bank Locator: BRANCH 0 CHANNEL 3 DIMM 1
        Bank Locator: BRANCH 1 CHANNEL 1 DIMM 0
        Bank Locator: BRANCH 1 CHANNEL 1 DIMM 1
        Bank Locator: BRANCH 1 CHANNEL 2 DIMM 0
        Bank Locator: BRANCH 1 CHANNEL 2 DIMM 1
        Bank Locator: BRANCH 1 CHANNEL 3 DIMM 0
        Bank Locator: BRANCH 1 CHANNEL 3 DIMM 1
 
内存顺序是从上向下1-12.根据报错信息CPU_SrcID#0_Channel#3_DIMM#1 : 得到CPU_SrcID 0,CHANNEL 3,DIMM 1。
 
可以判断为第六条条内存故障,也可以说第一颗cpu控制内存区域,CHANNEL为3,内存id为1。

转载于:https://www.cnblogs.com/dailidong/p/7571211.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值