- 博客(13)
- 收藏
- 关注
原创 Swin Transformer + YOLO系列!(以YOLOv11为例) 层级式特征提取 猛猛提点!保姆级手把手教程来了!(已出单版!!!!)
上图为Swin Transformer网络结构图传统检测基于卷积思想(CNN)进行特征提取,CNN更为关注局部特征,忽略了局部与局部之间的联系,而Transformer很好地解决了这一问题。Swin Transformer更多地结合了计算机视觉的先验知识,实现了与卷积神经网络类似的层级化结构设计,通过Self Window、Shifted Window配对的灵活的自注意力机制,使得网络在较浅的层级就已经拥有了覆盖全局的感受野,拥有全局建模的能力,并且提高了模型的计算性能。详细内容,请见原文。
2025-03-17 17:13:20
896
原创 Python批量修改xml与图像间对应关系,实现VOC数据集打乱(shuffle)
自己制作的数据集每个类别都相互在一起,数据集并未打乱,这会导致网络在学习过程中对权重参数产生一定的拉扯,降低了模型的鲁棒性。而且在训练时使用shuffle只是打乱每个轮次训练数据的顺序,并没有彻底改变数据集的顺序问题。,但是两个工作在我使用的时候都出现了xml文件名与images图像无法对应,标签都乱了(这是最主要的问题,会导致模型训练得乱七八糟);针对标签乱了的问题,我仔细检查几次运行得结果,发现是读取jpg文件和xml文件时顺序不一样,所以最后无法对应,因此参考这篇博客。此前参考两位博主的代码。
2024-11-06 16:43:34
195
1
原创 MASK-RCNN只保留检测框,去掉mask(MMdetection),改检测框的颜色
使用mmdetection时,想去掉demo测试时的mask
2023-07-10 13:45:43
895
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人