1. 情景介绍
当我们在服务器上训练模型时,防止意外等断开与服务的链接从而导致训练终止,一个比较好的解决方法就是使用nohup。
2. 使用方法
nohup commond
例如:下面就是在后台训练模型的命令。
nohup train.py
原程序的的标准输出被自动改向到当前目录下的nohup.out文件,起到了log的作用。
如果你希望看到训练日志,在训练的目录下运行下面命令:
tail -fn 50 nohup.out
点评:如果训练模型的时间较长,并别有可能出现断电等断开与服务器链接的情况,使用nohup。
本文介绍如何利用nohup命令确保模型训练任务在服务器断开连接的情况下也能继续进行。通过将标准输出重定向至nohup.out文件,便于查看训练日志。
4472

被折叠的 条评论
为什么被折叠?



