fatal error: cusparse.h: No such file or directory
1. 安装deepspeed时,遇到raise MissingCUDAException(“CUDA_HOME does not exist, unable to compile CUDA op(s)“)
2. 按照一篇优快云博客的指导,运行 conda install -c nvidia cuda-compiler
3. 虽然解决了MissingCUDAException,但是在开始跑deepspeed时,遇到fatal error: cusparse.h: No such file or directory
4. 研究了半天,发现是cuda-compiler在安装时,cuda-compiler 仅包含编译器和相关工具,并不包括完整的 CUDA Toolkit(例如,运行时库、头文件、示例代码等)。为了完整的开发环境,您通常需要安装其他相关的包,如 cudatoolkit 和
cudatoolkit-dev。
5. 自己卸载了 conda remove cuda-compiler
6. 手动重新安装conda install nvidia/label/cuda-12.1.1::cuda-toolkit
7. conda nvidia package web: https://anaconda.org/nvidia/cuda-toolkit
8. 安装deepspeed git clone https://github.com/microsoft/DeepSpeed.git
9. cd DeepSpeed
10. DS_BUILD_UTILS=1 DS_BUILD_FUSED_ADAM=1 pip install .