客户的一台联想RD830异常关机,在手工起来运行一天后又再次宕机,报以下错误:
CRITICAL Event: Internal error during firmware execution. Image shall be updated to other version or hardware board repair is needed (if error is persistent). - Asserted
初步判断机器的主板存在故障,于是使用备件进行了主板的更换。更换后对机器加电,系统在启动过程中停在图形登录界面,无法操作。

初步怀疑是图形界面启动的问题,由于Redhat 5.8启动菜单中没有救援选项,因此使用操作系统光盘进入救援模式。在救援模式下,将文件/etc/inittab的启动级别由5更改为3,然后再重启系统。
启动过程中还是报错误“Out of memory and no killable processes…”。

于是,尝试进入单用户模式(在GRUB菜单中使用e编辑kernel行在最后加上single来启动系统进入单用户模式,或在救援模式下将文件/etc/inittab的启动级别更改为1),结果还是报相同的错误:

再次进入救援模式,注销掉/etc/fstab文件中的swap行,让系统在启动时不添加swap空间。
重启后可以进入单用户模式,于是手工添加swap空间,可是在添加过程中又报错误“Out of memory

本文记录了一台联想RD830服务器在更换主板后,由于HugePages设置不当导致内存不足的故障过程。通过单用户模式和调整hugepages参数,解决了系统启动问题。关键词:联想RD830, 主板故障, HugePages, Oracle, Redhat5.8
最低0.47元/天 解锁文章
1519

被折叠的 条评论
为什么被折叠?



