自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

m0_56520034的博客

原创 Swin Transformer + YOLO系列!（以YOLOv11为例）层级式特征提取猛猛提点！保姆级手把手教程来了！（已出单版！！！！）

上图为Swin Transformer网络结构图传统检测基于卷积思想（CNN）进行特征提取，CNN更为关注局部特征，忽略了局部与局部之间的联系，而Transformer很好地解决了这一问题。Swin Transformer更多地结合了计算机视觉的先验知识，实现了与卷积神经网络类似的层级化结构设计，通过Self Window、Shifted Window配对的灵活的自注意力机制，使得网络在较浅的层级就已经拥有了覆盖全局的感受野，拥有全局建模的能力，并且提高了模型的计算性能。详细内容，请见原文。

2025-03-17 17:13:20 896

原创笔记八：使用Python统计COCO（json文件）中每类标签的个数

【代码】使用Python统计COCO（json文件）中每类标签的个数。

2024-11-07 16:16:41 203

原创 Python批量修改xml与图像间对应关系,实现VOC数据集打乱（shuffle）

自己制作的数据集每个类别都相互在一起，数据集并未打乱，这会导致网络在学习过程中对权重参数产生一定的拉扯，降低了模型的鲁棒性。而且在训练时使用shuffle只是打乱每个轮次训练数据的顺序，并没有彻底改变数据集的顺序问题。，但是两个工作在我使用的时候都出现了xml文件名与images图像无法对应，标签都乱了（这是最主要的问题，会导致模型训练得乱七八糟）；针对标签乱了的问题，我仔细检查几次运行得结果，发现是读取jpg文件和xml文件时顺序不一样，所以最后无法对应，因此参考这篇博客。此前参考两位博主的代码。

2024-11-06 16:43:34 195 1

原创笔记：图片下采样

注意：数据预处理流程应为原图—（归一化）—RGB—下采样。

2024-01-04 21:57:16 374 1

原创 MASK-RCNN只保留检测框，去掉mask（MMdetection），改检测框的颜色

使用mmdetection时，想去掉demo测试时的mask

2023-07-10 13:45:43 895 2

原创笔记八：批量文件重命名

文件批量重命名

2023-03-07 13:11:03 128

原创笔记七：labelimg标注的VOC格式（xml文件）转coco格式（json）

labelimg转coco

2022-12-26 18:24:29 757 1

原创笔记六：图像全局最大最小值归一化，多图批量处理

笔记六：图像全局最大最小值归一化，多图批量处理

2022-12-14 18:42:54 490 2

原创笔记五：图片（文件）shuffle，程序需要放在待处理文件夹同级目录

笔记五：图片（文件）shuffle，程序需要放在待处理文件夹同级目录

2022-12-12 18:50:28 137

原创笔记四：tif 转 jpg，支持批量

笔记四：tif 转 jpg，支持批量（图片在哪个文件夹就把程序放进哪个文件夹再运行）

2022-12-11 19:01:26 609

原创笔记三：灰度（位深度8）转RGB（位深度24），支持批量

笔记三：灰度（位深度8）转RGB（位深度24），支持批量

2022-12-11 18:57:33 720

原创笔记二：uint16转uint8（图像拉伸）

笔记二：uint16转uint8（图像拉伸）

2022-12-11 15:13:33 799

原创笔记一:拼接、补全图片

笔记一:拼接、补全为指定大小图片

2022-12-10 17:39:53 179 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

MA_DDup 优快云认证博客专家优快云认证企业博客

码龄4年

IP 属地：浙江省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

13: 原创

111万+: 周排名

8万+: 总排名

6388: 访问

: 等级

194: 积分

14: 粉丝

40: 获赞

7: 评论

41: 收藏

私信

关注

热门文章

最新评论

Python批量修改xml与图像间对应关系,实现VOC数据集打乱（shuffle）
优快云-Ada助手: 推荐 Python入门技能树：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python
笔记：图片下采样
优快云-Ada助手: 恭喜作者发布了第10篇博客，看来你在图片处理方面有着丰富的知识和经验。希望你可以继续坚持创作，分享更多有价值的内容。或许接下来可以考虑写一些实际案例或者应用场景，让读者更容易理解和应用你分享的知识。期待你的下一篇作品！
MASK-RCNN只保留检测框，去掉mask（MMdetection），改检测框的颜色
C温: 请问大佬，检测框的标签背景怎么去掉呢
MASK-RCNN只保留检测框，去掉mask（MMdetection），改检测框的颜色
优快云-Ada助手: 恭喜您写了第9篇博客！阅读了您的标题，我对您的创新思路感到非常兴奋。您的想法似乎是将MASK-RCNN中的mask去掉，仅保留检测框，并改变检测框的颜色。这种思路非常有趣，可以将焦点更加集中在目标检测上，同时也为视觉效果带来了新的变化。我认为这个想法可以进一步优化和拓展。在下一步的创作中，或许您可以考虑探索不同颜色的检测框对于目标检测的影响，或者尝试将不同形状的框应用于不同类型的目标上。此外，您还可以考虑探索如何根据目标的类别或重要程度，为不同的检测框分配不同的颜色。这些创意都可以进一步提升您的模型的可解释性和视觉效果。总之，我对您的创新思路感到非常赞赏，期待您在未来的博客中继续分享更多有趣的想法和成果。祝您一切顺利！
笔记七：labelimg标注的VOC格式（xml文件）转coco格式（json）
小张张.。: 为什么 json里文件名是这个 "file_name": "QJ6335444501.jpg",

最新文章

提示

确定要删除当前文章？

取消删除