CV改进模块
文章平均质量分 86
CV领域的模型改进
Virgil139
谁终将点燃闪电,必长久如云漂泊。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
TGRS2023 基于小波池化和图增强分类的无人机小目标跟踪
本文提出了一个基于孪生神经网络的航空跟踪器(SmallTrack),该框架通过小波池化层和图增强模块,显著提升了模型在复杂航空场景中精确跟踪小目标的能力,同时保持了72.5帧/秒的高速运行速度。原创 2025-07-13 13:06:24 · 506 阅读 · 0 评论 -
CVPR2025 Mamba系列论文
MambaOut代码MambaOut: Do We Really Need Mamba for Vision?CVPR2025 MobileMamba代码MobileMamba: Lightweight Multi-Receptive Visual Mamba Network[ECCV24] MambaIR: A Simple Baseline for Image Restoration with State-Space Model[CVPR25] MambaIRv2: Attentive State原创 2025-07-12 22:43:34 · 613 阅读 · 0 评论 -
CVPR2022 RepLKNet与CVPR2024 UniRepLKNet
图 1. 分别为 ResNet-101/152 和 RepLKNet-13/31 的有效感受野(ERF)。分布范围更广的深色区域表明有效感受野更大。增加网络层数(例如从 ResNet-101 到 ResNet-152)对扩大有效感受野的作用甚微。相比之下,我们的大核模型 RepLKNet 能有效获得更大的有效感受野。之前有个经验性的结论,把一个5x5的卷积核换成两个3x3的,参数量减少但效果相同。ViT是的多头注意力机制(MHSA)可以对输入的特征全局建模,相当于感受野是全局,而CNN只能获取到局部信息。原创 2025-07-10 20:11:20 · 693 阅读 · 0 评论 -
YOLOv11改进点总结
的改进:相比较于YOLOv8模型,其将CF2模块改成C3K2,同时在SPPF模块后面添加了一个C2PSA模块,且将YOLOv10的head思想引入到YOLO11的head中,使用深度可分离的方法,减少冗余计算,提高效率。原创 2025-06-17 19:39:13 · 2411 阅读 · 0 评论 -
YOLOP2层改进
在目标检测任务中,P2 层(分辨率为输入图像 1/4 的特征层)主要负责捕获小目标细节特征。如何改进呢,仅需修改原yolo11.yaml配置文件,即可修改网络结构。yolov11原yaml文件:yolo11.yaml。p2改进后的,yolo11-p2.yaml。官方yolov12.yaml文件内容,原创 2025-07-02 02:36:50 · 653 阅读 · 0 评论 -
CV领域的Wavelet系列改进总结
图像的频域特征(如低频分量对应平滑区域、高频分量对应边缘 / 纹理)具有更强的语义区分性。例如,低频成分可捕捉整体轮廓,高频成分可捕捉细节变化,这使得频域分析能更高效地分离和处理不同类型的视觉信息。原创 2025-07-08 02:31:54 · 313 阅读 · 0 评论
分享