最近在搞CentOS,安装起来也是挺简单的,但是在安装nVidia驱动和CUDA上遇到了问题,折腾了两天多,百度必应轮换着查,又重装了一次系统,才找出问题的所在。
网上可以查到的安装nVidia驱动的方法有两种,一种是下载runfile,另一种是从elrepo中直接安装。第一种需要修改不少地方,如果不细心还是容易出问题的,第二种相对简单,在安装过程中程序会自动修改相应的文件,并且卸载的时候又会自动将修改的文件复原,不太容易出问题。这两种办法我都试了,都遇到了相同的问题,在reboot之后startx报错:
fatal server error: no screen found
……
xinit: unable to connect to x server
相信有不少同学都遇到了这种问题,怎么解决呢?后续再说。
之前提到安装nVidia驱动有两种方法,但是这两种方法我试了,都死活安不上,没办法,我用
yum remove *nvidia*
删除了所有可能的nVidia包,直接安装CUDA,希望没有nVidia驱动也能安上CUDA。尽管这么做并不行(想想也是),但是我发现一个有趣的现象:在安装CUDA的过程中,nVidia包会自动被安装。那么,我就不管nVidia驱动了,直接上CUDA!
因为我用不同的方法试了好几次,无论用什么方法,运行nvidia-smi都会报这样的错误:
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver.
Make sure that the latest NVIDIA driver is installed and running
我查阅了一些网页,以为是因为我安装了不同版本包的缘故(后来发现并不是这个原因,真的是因为nVidia driver没有running啊!),所以我就直接重装了系统,从头开始。
这