上周由于公司两次突然的断电,导致公司内部的linux服务器出现异常.
表现为 终端出现: host kernel: journal commit I/O error 的报警信息
然后所有的文件都变为了只读.也无法再通过ssh登陆到服务器. 无奈之下只好关机硬重启.
重启之后一切恢复正常.于是也没有太在意这个事.唉, 看没还是没有运维敏锐的嗅觉,于是错过了最佳的时机.
第二天上午突然又报了 host kernel: journal commit I/O error 的错误.表现和昨天一样.这时候开始意识到问题可能有些严重.
而刚此时终端是链接在服务器上的.于是 极其错误的输入了 reboot指令.寄希望于重启之后可以恢复正常.
然后reboot失败.一直报错. 大概就是 main kernel: BUG: soft lockup CPU#1 stuck for 10s! 一类的提示
<