- 博客(2)
- 收藏
- 关注
原创 基于Ultralytics的RT-DETR、YOLO模型数据增强(YOLO格式)
摘要:RT-DETR作为基于Transformer的目标检测模型,在数据需求、参数量和训练难度上与YOLO系列存在显著差异。针对小数据集(如275张猫狗图像)训练时,RT-DETR易出现过拟合和收敛困难的问题。通过Albumentations库实现多维度数据增强(包括几何变换、颜色调整、模糊噪声和随机遮挡),将原始数据集扩展10倍,有效缓解Transformer架构的数据饥饿问题。
2025-10-04 11:33:00
443
原创 解决YOLOv12在华为Ascend NPU上FlashAttention导入错误:NPU融合算子替换详解
摘要:本文介绍了在华为Ascend NPU上训练YOLOv12模型时,解决FlashAttention导入错误的方法。针对无法安装FlashAttention的情况,提出了使用华为昇腾NPU融合算子替换方案的实现步骤。关键点包括:1) 修改block.py中的导入逻辑,2) 实现NPU融合算子替换,3) 处理参数映射和设备转换。该方法通过try-except机制实现了FlashAttention、NPU融合算子和PyTorch原生注意力的多级降级方案,确保了模型在不同硬件环境下的兼容性。
2025-06-17 02:22:39
1762
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅