CV Method
文章平均质量分 91
WiSirius
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
CV method: YOLOv12(v11 进化!)
YOLOv12 来了,同样由ultralytics公司出品(这更新速度可是够快的了)1) 简单有效的区域注意力机制(area-attention)2)高效的聚合网络R-ELANYOLOv12总体来说改动不大,主要还是结构上的创新,其实注意力用在目标检测早就不是什么新鲜事了,主要YOLO12做到了使用它的同时依然保持实时目标检测(虽然感觉也没有太发挥注意力机制的潜力)。不过也是一次很棒的尝试,感觉YOLOv13很快就要来了,hhhhh。原创 2025-03-25 15:52:42 · 794 阅读 · 0 评论 -
CV method: YOLOv11 (YOLOv8的进化之旅)
YOLO已经出到v11,感觉这两年yolo的更新速度有点频繁啊!本文主要分析一下v11的核心改动!v11与v8相同出自ultralytics,不过v10也是基于v8的代码架构构建的。这一次YOLOv11的变化相对于ultralytics公司的上一代作品YOLOv8变化不是很大,主要变化在于模型的结构设计。2)引入C2PSA;3)head修改;4)模型深度宽度变化;模型架构如下YOLO v11 终于引入了MHA,也算是一个重要里程碑了,新的结构设计也为YOLO未来发展奠定基础。原创 2025-01-15 18:55:17 · 2102 阅读 · 0 评论 -
CV Method:YOLOv10 vs YOLOv8
YOLOv10已经开源一段时间了,经过我实际使用测试,也确实性能更好一些,YOLOv10基于v8代码框架改进,so 之前v8可用的大部分trick在v10上可直接代码移植过去(我自己尝试了下,大部分code不需要改动,直接实现装备继承)。本文主要比较一下v10 和 v8之间的区别和改进。yolov10最重要的point就是它的 NMS-free 检测功能,我们知道NMS是检测发展中重要的一环,yolov10通过one-to-onehead实现了不需要NFS的检测模型,这可以有效提升模型的执行速度。原创 2024-07-24 16:58:42 · 3650 阅读 · 0 评论 -
CV Method:超全学习率策略总结
在深度学习中,学习率对模型的训练过程起着很重要的作用,影响着损失函数的变化速度。学习率越低,可以确保不会错过任何局部最小值,但是也意味着将花费更长的训练时间来进行收敛,特别是陷入局部最优的情况下。学习率越高,就容易错过全局最小值导致结果不收敛。一般来说,batch-size的大小一般与学习率的大小成正比。batch-size越大一般意味着算法收敛方向的置信度越大,也可以选择较大的学习率来加快收敛速度。而小的batch-size规律性较差,需要小的学习率保证不出错。原创 2024-06-06 17:26:43 · 1307 阅读 · 0 评论 -
CV method:最新Backbone---TransNeXt
近几年,Vision Transformer(ViT)已成为各种CV任务的热门Backbone架构,也算是Transformer在CV领域的经典架构。注意力机制可以有效利用全局信息,获取每个像素间的相关性。但也由于这一特性,其平方复杂度和高内存消耗而面临挑战,这限制了其在高分辨率图像特征上的应用。作者基于生物模仿视杆细胞视觉设计的Token混合器聚合注意力和一种具有门控通道注意力的通道混合器卷积GLU。另外作者也在新结构中设计了很多最新技术,将它们结合起来,提出TransNeXt。原创 2024-04-17 11:38:54 · 1870 阅读 · 0 评论 -
CV Method:经典CNN Backbone总结
Backbone作为一切深度学习任务的基础,不论是理论还是实际应用都有重要的意义,本文针对经典Backbone进行总结,这些Backbone也是面试常见的问题,卷积网络主要以ResNet和其各种变体为主。本文主要介绍这些年比较经典的backbone的一些优势和特点,目前主流的backbone都以transformer为框架进行迭代,不过CNN的backbone是基础中的基础,能很好的帮助初学者理解相关理论和设计理念,也是必须要掌握的技术。原创 2024-05-30 17:36:13 · 1556 阅读 · 0 评论
分享