自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 Swin Transformer + YOLO系列!(以YOLOv11为例) 层级式特征提取 猛猛提点!保姆级手把手教程来了!(已出单版!!!!)

上图为Swin Transformer网络结构图传统检测基于卷积思想(CNN)进行特征提取,CNN更为关注局部特征,忽略了局部与局部之间的联系,而Transformer很好地解决了这一问题。Swin Transformer更多地结合了计算机视觉的先验知识,实现了与卷积神经网络类似的层级化结构设计,通过Self Window、Shifted Window配对的灵活的自注意力机制,使得网络在较浅的层级就已经拥有了覆盖全局的感受野,拥有全局建模的能力,并且提高了模型的计算性能。详细内容,请见原文。

2025-03-17 17:13:20 896

原创 笔记八:使用Python统计COCO(json文件)中每类标签的个数

【代码】使用Python统计COCO(json文件)中每类标签的个数。

2024-11-07 16:16:41 203

原创 Python批量修改xml与图像间对应关系,实现VOC数据集打乱(shuffle)

自己制作的数据集每个类别都相互在一起,数据集并未打乱,这会导致网络在学习过程中对权重参数产生一定的拉扯,降低了模型的鲁棒性。而且在训练时使用shuffle只是打乱每个轮次训练数据的顺序,并没有彻底改变数据集的顺序问题。,但是两个工作在我使用的时候都出现了xml文件名与images图像无法对应,标签都乱了(这是最主要的问题,会导致模型训练得乱七八糟);针对标签乱了的问题,我仔细检查几次运行得结果,发现是读取jpg文件和xml文件时顺序不一样,所以最后无法对应,因此参考这篇博客。此前参考两位博主的代码。

2024-11-06 16:43:34 195 1

原创 笔记:图片下采样

注意:数据预处理流程应为原图—(归一化)—RGB—下采样。

2024-01-04 21:57:16 374 1

原创 MASK-RCNN只保留检测框,去掉mask(MMdetection),改检测框的颜色

使用mmdetection时,想去掉demo测试时的mask

2023-07-10 13:45:43 895 2

原创 笔记八:批量文件重命名

文件批量重命名

2023-03-07 13:11:03 128

原创 笔记七:labelimg标注的VOC格式(xml文件)转coco格式(json)

labelimg转coco

2022-12-26 18:24:29 757 1

原创 笔记六:图像全局最大最小值归一化,多图批量处理

笔记六:图像全局最大最小值归一化,多图批量处理

2022-12-14 18:42:54 490 2

原创 笔记五:图片(文件)shuffle,程序需要放在待处理文件夹同级目录

笔记五:图片(文件)shuffle,程序需要放在待处理文件夹同级目录

2022-12-12 18:50:28 137

原创 笔记四:tif 转 jpg,支持批量

笔记四:tif 转 jpg,支持批量(图片在哪个文件夹就把程序放进哪个文件夹再运行)

2022-12-11 19:01:26 609

原创 笔记三:灰度(位深度8)转RGB(位深度24),支持批量

笔记三:灰度(位深度8)转RGB(位深度24),支持批量

2022-12-11 18:57:33 720

原创 笔记二:uint16转uint8(图像拉伸)

笔记二:uint16转uint8(图像拉伸)

2022-12-11 15:13:33 799

原创 笔记一:拼接、补全图片

笔记一:拼接、补全为指定大小图片

2022-12-10 17:39:53 179 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除