问题描述
在给V100显卡集群安装cuda11.8版本后出现nvidia指令调用与NVML版本不匹配问题
nvidia-smi
Failed to initialize NVML: Driver/library version mismatch

解决方式
Step1 查看显卡驱动
dpkg -l | grep nvidia
发现显卡驱动程序有两个版本:535.104.05、520.61.05
一般只要保留一个即可
Step 2 查看系统NVRM版本
cat /proc/driver/nvidia/version
