可能是突然看到一篇文章讲述如果将自己学习的过程写成博客,可以帮助自己更好的学习东西。再加上之前一直有问题看别人的博客,也萌生了自己也博客,总结一些掌握的,以后可能会用到的知识。
1. 检查是否可以使用GPU:
import tensorflow as tf
tf.test.is_gpu_available()
2. 查看linux 系统是不是ubuntu还是其他centos
lsb_release -a
3. 查看GPU当前使用情况
watch -n 10 nvidia-smi
4. Linux系统后台指定输出文件
nohup ./start.sh >output 2>&1 & #输出指定在output文件
5. nohup,命令后台运行后查看用ps,找到任务id以后,用kill id,可以停止程序
ps # 查看nohup命令后台运行任务id
kill id #找到任务id以后,用kill id,可以停止程序
6. 解压.gz文件 使用
gunzip FileName.gz
7.进入节点命令
用ssh 加节点名称
ssh cu14
ssh node41
8.退出节点命令
exit
本文分享了一系列在Linux环境下操作和监测GPU的实用技巧,包括如何检查GPU可用性、识别系统类型、监控GPU使用状况、后台运行命令并指定输出文件、使用nohup命令及停止程序、解压.gz文件、远程连接和退出节点等,为深度学习和高性能计算提供了便利。
194

被折叠的 条评论
为什么被折叠?



