nvidia相关命令:
nvidia-smi 显示当前GPU的所有基础信息
nvidia-smi -L 列出所有可用的NVIDIA设备
nvidia-smi -l [second] 每隔second秒刷新一次面板
nvidia-smi topo --matrix 查看系统拓扑
nvidia-smi -q -d CLOCLK 查看当前GPU时钟速度,默认时钟速度和最大可能的时钟速度
nvidia-smi -q -d SUPPORTED_CLOCKS 显示每隔GPU的可用时速速度列表
nvidia-smi vgpu 查看当前vgpu的状态信息
nvidia-smi gput -p 循坏显示虚拟桌面中应用程序对GPU资源的占用情况
nvidia-smi -q 查看当前所有GPU的信息,也可以通过参数 i 指定集体的GPU
nvidia-smi dmon 以1秒的更新间隔监控整体GPU使用情况
nvidia-smi pmon 以1秒的更新间隔监控每个进程的GPU使用情况
nvidia-smi -q | egrep -i seri 查看GPU温度
nvidia-smi -q | egrep -i apping 查看ECC纠错相关信息
nvidia-smi -q | egrep -i uncorr 查看显卡是否存在ECC纠错
dmidecode -t system 收集服务器SN
lsmod | grep peer 检查GPU优化
ibdev2netdev 检查GPU配置是否正常
硬件常用命令参数
于 2024-03-07 18:15:21 首次发布