这篇博客用来记录一些Linux上后台训练机器学习模型的时候可能用到的简短的代码(不定期更新)
目录:
- 后台执行python训练脚本
- 查看训练时占用的资源
- 中途停止模型的训练
1.后台执行python训练脚本
nohup python 脚本.py &
比如 nohup python word2vec_model.py &
如果只用 python 脚本.py & 那么会在断开ssh的时候停止执行代码,使用nohup命令会生成一个nohup.out文件,记录着所有的输出项和日志记录。
2.查看训练时占用的资源
top
这个命令可以直接看到资源占用情况,一般模型计算都比较占用cpu,因此这个命令快很准的直接得到想要的内容
按 q 退出
3.中途停止模型的训练
比如使用top命令直接得到了 PID 为 5374 的进程,它是一个训练脚本,现在停掉它,使用命令:
kill PID
比如这个例子:kill 5374