参考网址:
flash-Attention2安装和使用 - 李英俊小朋友 - 博客园
https://blog.youkuaiyun.com/Mugi_jiang/article/details/140773914
问题描述,通过从Releases · Dao-AILab/flash-attention官方下载了whl后,安装发现了这个报错
RuntimeError: Failed to import transformers.models.qwen2_5_vl.modeling_qwen2_5_vl because of the following error (look up to see its traceback):
/home/liver01/miniconda3/envs/Swift/lib/python3.10/site-packages/flash_attn_2_cuda.cpython-310-x86_64-linux-gnu.so: undefined symbol: _ZN3c105ErrorC2ENS_14SourceLocationENSt7__cxx1112basic_stringIcSt11char_traitsIcESaIcEEE
解决分析:
我下载的是True版本,更换False版本后重新下载,发现报错未解决。
怀疑是pip uninstall flash-attn 包卸载的时候哪里没卸载干净。
查阅文献发现,可能是nvidia-cublas-cuxx这个包不对,把对应版本的卸载后,重新从flase版本的whl去安装,问题解决。
flash-attn2安装报错解决
1526

被折叠的 条评论
为什么被折叠?



