这几天训网络最困扰我的问题就是服务器总是莫名其妙自动重启,一旦重启,训练的各种网络就都中断了,之后又得一个一个断点续训练,很费劲
两天之内重启了3次之后我实在忍不了了,决定查一下问题的根源
cd /var/log
gedit syslog
或者直接
dmesg
打开系统日志之后发现每次重启之前都会出现很多
EXT4-fs error (device sda1): ext4_lookup:1593: inode #6004222: comm trash-expunge: deleted inode referenced: 6004301
类似这样的错误,看样子是sda1磁盘文件系统的问题
于是可以用fsck修复sda1这一磁盘分区,在修复之前我用一个上午的时间手动把这个8T硬盘里重要的数据备份了一遍…(最后这些数据都没丢…)
文件备份之后,首先umount
umount /dev/sda1
然后执行
fsck /dev/sda1 -y
-y的作用是默认全选yes,即修复过程中出现要删除,要修正等选项系统自动帮忙选yes,这样带来的一个风险是可能会删掉一些重要文件,但鉴于我已经备份过,而且出buge的文件太多,根本点不过来,所我直接默认yes了
于是问题完美解决…
这件事情启示我遇到问题就应该尽快查明原因解决,第一次电脑异常重启包括出现文件系统bug提示的时候我都苟着,结果bug不停累积,重启越来越频繁,重启之后恢复工作环境花费的时间可能比解决问题都要长…