查看显卡及GPU相关信息,指定GPU、CPU运行

本文介绍在Linux系统中查看设备信息及相关操作。包括查看TensorFlow支持的CPU和GPU设备信息,如显卡型号的静态与动态查看;指定GPU、CPU运行的方法;查看CPU的操作;还介绍了zip压缩和解压缩命令的安装及多种使用方式,如绝对路径、相对路径、单文件压缩等。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

原作者使用的是CentOs环境进行配置的,经过使用,实际上,Linux也是可以的。
以下是原作者的得文章内容

一、查看信息

在一套标准的系统上通常有多个计算设备. TensorFlow 支持 CPU 和 GPU 这两种设备. 我们用指定字符串 strings 来标识这些设备. 比如:

  • "/cpu:0": 机器中的 CPU
  • "/gpu:0": 机器中的 GPU, 如果你有一个的话.
  • "/gpu:1": 机器中的第二个 GPU, 以此类推...

如果一个 TensorFlow 的 operation 中兼有 CPU 和 GPU 的实现, 当这个算子被指派设备时, GPU 有优先权. 比如matmul中 CPU 和 GPU kernel 函数都存在. 那么在 cpu:0 和 gpu:0 中, matmul operation 会被指派给 gpu:0 .

查看显卡型号

lspci | grep -i vga
 

1.nvidia

静态查看

nvidia-smi
 

动态查看

watch -n 0.5 nvidia-smi
 

上面的表格中:
第一栏的Fan:N/A是风扇转速,从0到100%之间变动,这个速度是计算机期望的风扇转速,实际情况下如果风扇堵转,可能打不到显示的转速。有的设备不会返回转速,因为它不依赖风扇冷却而是通过其他外设保持低温(比如我们实验室的服务器是常年放在空调房间里的)。
第二栏的Temp:是温度,单位摄氏度。
第三栏的Perf:是性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能。
第四栏下方的Pwr:是能耗,上方的Persistence-M:是持续模式的状态,持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态。
第五栏的Bus-Id是涉及GPU总线的东西,domain:bus:device.function
第六栏的Disp.A是Display Active,表示GPU的显示是否初始化。
第五第六栏下方的Memory Usage是显存使用率。
第七栏是浮动的GPU利用率。
第八栏上方是关于ECC的东西。
第八栏下方Compute M是计算模式。
下面一张表示每个进程占用的显存使用率。

2.intel

1)安装intel-gpu-tools工具

yum install intel-gpu-tools
 

2)安装完毕后, 系统中会多种三个gpu工具: intel_gpu_abrt   intel_gpu_time   intel_gpu_top

其中,常用的是intel_gpu_top和intel_gpu_time。

二、指定GPU、CPU运行

1.TensorFlow只在CPU上运行的方法


 
  1. import os
  2. os.environ[ "CUDA_DEVICE_ORDER"] = "PCI_BUS_ID"
  3. os.environ[ "CUDA_VISIBLE_DEVICES"] = "-1"

注:上述代码一定要放在import tensorflow或keras等之前,否则不起作用。

2.在多GPU系统里使用单一GPU

为了获取你的 operations 和 Tensor 被指派到哪个设备上运行, 用 log_device_placement 新建一个 session, 并设置为 True.


 
  1. # 新建一个 graph.
  2. with tf.device( '/gpu:0'):
  3. a = tf.constant([ 1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[ 2, 3], name= 'a')
  4. b = tf.constant([ 1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[ 3, 2], name= 'b')
  5. c = tf.matmul(a, b)
  6. # 新建 session with log_device_placement 并设置为 True.
  7. sess = tf.Session(config=tf.ConfigProto(log_device_placement= True))
  8. # 运行这个 op.
  9. print sess.run(c)

3.kreas


 
  1. import os
  2. os.environ[ 'CUDA_VISIBLE_DEVICES'] = '0' if on_server is False else '0,1'

三、查看CPU

top
 

终止

kill+PID
 

ctrl+c退出

压缩方式和压缩命令很多。我只讲最经常用到的zip压缩,zip压缩的参数也比较多,只讲最常用的几种组合方式。

 

四、我们安装2个命令

压缩命令 zip

解压缩命令 unzip

安装命令是:yum install -y unzip zip

1.绝对路径压缩

你当前处于/home/html目录下,如何把html文件夹打包压缩成html.zip呢?

输入命令:zip -r html.zip /home/html 即可

-r 指代递归,压缩文件夹下面的所有文件和文件夹


2.相对路径压缩

输入命令:zip -r html.zip html 即可


3.单文件压缩

输入命令:zip -r html.zip good.log 即可


4.解压缩到当前目录

输入命令:unzip html.zip


5.解压缩到指定目录但不覆盖

解压到指定目录,如果该目录下已经有同名的文件,不覆盖指定目录下的文件

例如:把html.zip 解压缩到 /usr 目录下

输入命令:unzip -n html.zip -d /usr


6.查看压缩文件内的文件但是不解压缩

输入命令:unzip -v html.zip
 

https://ptorch.com/docs

https://tensorflow.google.cn/tutorials/

https://blog.youkuaiyun.com/ejinxian/article/details/86574218

https://blog.youkuaiyun.com/jia666666/article/details/81449163

http://tushare.waditu.com/trading.html

https://blog.youkuaiyun.com/qq_27280237/article/details/82021222


转自:
CentOS查看显卡及GPU相关信息,指定GPU、CPU运行 - GlassySky的博客 - 优快云博客
https://blog.youkuaiyun.com/qq_38784098/article/details/86536078

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值