Windows系统下安装运行YOLOv12所需的flash_attn 包教程

原创已于 2025-12-10 14:08:27 修改 · 2k 阅读

28 ·

CC 4.0 BY-SA版权

文章标签：

#YOLOv12 #flash_attn #windows

于 2025-02-20 19:11:02 首次发布

刚刚又发现其实不用安装flash_attn包也能运行YOLOv12。

方法一：不安装flash_attn包

1.将D:\personalFiles\objectDetection\comparativeExperiment\yolov12\ultralytics\nn\modules\block.py里的代码

try:
    from flash_attn.flash_attn_interface import flash_attn_func
except Exception:
    assert False, "import FlashAttention error! Please install FlashAttention first."

删去或注释掉。

2.再将里面的if x.is_cuda:替换为if False:即可

方法二：安装flash_attn包

给出本人运行成功的参考版本

0.python版本：3.11

1.CUDA版本：12.2

2.torch版本：2.3.1+cu121 ，安装此版本代码：

①从官网安装（应该慢些）：pip install torch==2.3.1 torchvision==0.18.1 torchaudio==2.3.1 --index-url https://download.pytorch.org/whl/cu121

②更快的网站：pip install torch==2.3.1 torchvision==0.18.1 torchaudio==2.3.1 -f https://mirrors.aliyun.com/pytorch-wheels/cu121

3.下载有关flash_attn包的whl文件至桌面，下载网站为https://github.com/kingbri1/flash-attention/releases/download/v2.5.9.post1/flash_attn-2.5.9.post1+cu122torch2.3.1cxx11abiFALSE-cp311-cp311-win_amd64.whl，然后在桌面desktop文件夹里输入cmd打开命令行窗口或通过cd desktop进入桌面文件夹安装此包，最后输入命令

pip install flash_attn-2.5.9.post1+cu122torch2.3.1cxx11abiFALSE-cp311-cp311-win_amd64.whl

安装就成功了，完整示例：

(yolov12) C:\Users\15231\Desktop>pip install flash_attn-2.5.9.post1+cu122torch2.3.1cxx11abiFALSE-cp311-cp311-win_amd64.whl

PS：运行时可能还会有有关其他包的2处警告，觉得碍眼可进行如下修改：

1.将D:\personalFiles\objectDetection\comparativeExperiment\yolov12\ultralytics\nn\modules\block.py里的from timm.models.layers import trunc_normal_换为from timm.layers import trunc_normal_。

2.将D:\personalFiles\objectDetection\comparativeExperiment\yolov12\ultralytics\data\augment.py里的A.ImageCompression(quality_lower=75, p=0.0),换为A.ImageCompression(p=0.0),

经实验验证改动后对训练结果无影响，OJBK了，终于能跑通了，这flash包太他M挑环境了，试了N次才找到这个合适的，规律就是CUDA为12.2，那么torch就应该为12.1版而不是11.8版的，python为3.11那么就要下载3.11对应的whl文件，反正尽可能各版本一致对应起来

13 条评论

浅蘭。 2025.09.16
我配好了flash_attention反而根本检测不出来了，连using flash都没有，不知道怎么回事，验证过了环境肯定没问题。

浅蘭。 2025.09.16
那cuda是12.4版本呢

YuLu9wink 2025.04.24
请问下代码能训练就表示flashattention正确安装了吗？为什么训练速度比v8慢呢
- YuLu9wink回复寥落半伤感 2025.04.25
  up主可否私信下vx，想请教训练的问题，研一刚入坑
- 寥落半伤感回复YuLu9wink 2025.04.25
  能训练就成功了呗，没正确安装代码会报错不能训练的呀，为什么慢它就是慢啊，我看了下我的数据集v8是三十几秒一个epoch，同样数据集v12直接变成六十几秒了

大大DK 2025.04.13
下不起

2401_84654285 2025.04.02
我的是CUDA11.8，找不到对应的flash_attn

yhh245 2025.03.24
把flashattention删了会影响精度吗
- yhh245回复寥落半伤感 2025.04.06
  我用来做对比实验的，yolov12的效果确实比以往的yolo version要好
- 寥落半伤感回复yhh245 2025.03.24
  我对比了一下，删了这个精度还高些[face]emoji:010.png[/face]，你也可以对比下，说不定不删用原版的高些，精度肯定会变的，至于高还是低就只能通过实测得知了

い城北亦无寒 2025.03.14
ERROR: flash_attn-2.5.9.post1+cu122torch2.3.1cxx11abiFALSE-cp311-cp311-win_amd64.whl is not a supported wheel on this platform.
- 寥落半伤感回复い城北亦无寒 2025.03.15
  文中列出的0-2这三个东西的版本你有的跟我的不一样吧，就是不版本不一致才出现你说的问题，所以我才发一个能运行的版本给出参考，你要是不改这三个的版本，那就去这个网站找其他版本的whl文件，这个下载网址只输入到download这里应该就能看到下其他版本的页面了