- 博客(23)
- 收藏
- 关注
原创 即插即用| DASI 模块通过一种新颖的通道分割选择机制,根据物体的尺寸和特征自适应地选择融合的特征,从而提高小目标的显著性。
DASI 模块通过自适应选择融合的特征,有效地解决了红外小目标检测中特征信息丢失和背景杂乱的问题,从而提高了小目标的显著性,并最终提升了检测性能。DASI 模块根据物体的尺寸和特征自适应地选择融合的特征的,这种自适应融合策略如何提高小目标的显著性。通过自适应选择高维特征和低维特征,DASI 可以有效地保持小目标的细节信息,例如轮廓和纹理特征,从而提高小目标的可识别性。通过融合低维特征,DASI 可以增强小目标的上下文信息,例如周围背景的特征,从而提高小目标与背景的区分度。
2024-07-15 15:18:08
893
原创 cloformer,可用于主干网络提取特征,融合低频和高频信息
AttnConv模块:作者介绍了一个名为AttnConv(注意力卷积)的新模块,该模块将卷积的优点与共享权重以及自我注意力与内容感知权重的局部感知相结合。双分支架构:CloFormer 具有双分支结构 - 一个使用 AttnConv 捕获高频信息的本地分支,以及一个使用标准注意力和池化的全局分支来捕获低频全局信息。模型变体:本文介绍了三种模型变体 - CloFormer-XXS、CloFormer-XS 和 CloFormer-S,它们具有不同的模型大小,针对移动设备上的不同计算预算。
2024-03-31 17:54:47
1075
原创 内容引导注意力特征融合CGAfusion
计算机视觉即插即用模块。0.5一个。进行模块缝合,水论文,原文用于图像去雾。自己也可以用于分割等。
2024-03-23 15:42:02
3680
1
原创 AKConv:具有任意采样形状和任意数量参数的卷积核
可以节约你的时间,有更多的时间用于学习。tk=DeDWWMUFGGn HU9196 计算机视觉即插即用模块。0.5一个。进行模块缝合,水论文,争取更快的满足毕业要求。
2024-03-19 15:57:30
1003
原创 [即插即用]特征融合pag 计算机视觉即插即用模块,
该模块用于在细节分支(P branch)从包含丰富准确语义信息的I分支学习有用特征时,防止细节分支受到过多背景或全局上下文信息的压制,实现选择性地学习高层语义信息。具体来说,Pag模块通过计算P分支和I分支对应像素特征向量的点积并经过Sigmoid函数得到一个可能性值σ,表示这两个像素可能属于同一对象的程度。在实时语义分割中,现有的双分支网络结构虽然高效,但在融合高分辨率细节信息和低频上下文信息时存在局限性,即细节特征容易被周围环境信息淹没,导致过拟合现象,从而限制了现有模型分割精度的提升。
2024-03-10 15:17:48
1293
2
原创 Shift-ConvNets:具有大核效应的小卷积核
实验结果表明,我们的移位操作符显著提高了常规CNN的准确性,同时显著减少了计算需求。在ImageNet-1k上,我们的移位增强CNN模型优于当前最先进的模型。然而,典型的大的卷积核在硬件上并不友好,导致各种硬件平台的兼容性降低。因此,简单地增大卷积核的大小是不明智的。实验结果表明,该操作可以显著提高常规CNN的准确度,同时显著降低计算需求。由深圳大学发布的文章,Shift-ConvNets:具有大核效应的小卷积核,对硬件设备友好。如何在不增加卷积核大小的情况下,提高卷积神经网络(CNN)的性能。
2024-02-04 08:43:58
626
1
原创 华中科技大学发布的视觉新颖架构,Vision Mamba
Vim是首个纯SSM基线模型成功应用于密集预测任务,如语义分割、目标检测和实例分割等,并且与现有的典型视觉Transformer模型DeiT相比,在ImageNet分类任务上表现出更高的性能,同时在处理大尺寸图像时速度更快,GPU内存占用更少。通过将Mamba中高效的状态空间模型方法引入计算机视觉,Vim不仅保留了Transformer风格模型对大规模无监督预训练和多模态应用友好的优点,而且克服了处理长序列时的计算和内存约束,为下一代视觉基础模型提供了可能的后端结构。
2024-01-20 08:42:10
1055
原创 即插即用 | ICCV2023,上采样策略
作者绕过动态卷积,从点采样的角度制定上采样,资源效率更高,可以通过 PyTorch 中的标准内置函数轻松实现。本文讨论了最近基于内核的动态上采样器(如 CARAFE、FADE 和 SAPA)引入的工作负载问题,这主要是由于耗时的动态卷积和用于生成动态内核的附加子网络。DySample 不需要定制的 CUDA 包,与以前基于内核的动态上采样器相比,参数、FLOP、GPU 内存和延迟要少得多。输入为(2,64,32,32),输出为(2,64,64,64),对输入数据进行了上采样。
2024-01-19 20:41:54
2669
1
原创 DCNv4,高效可变形卷积
此外,DCNv4还成功地整合到了包括ConvNeXt、ViT在内的多种现代主干网络结构中,并在图像生成任务中展现出超越基线模型的能力,显示了其作为通用视觉运算符的巨大潜力。文章指出尽管Deformable Convolution v3 (DCNv3) 结合了稀疏注意力机制与卷积操作,在处理具有局部性、动态采样点以及输入依赖权重的空间特征聚合方面表现出色,但其运行速度较慢且在训练初期收敛速度不如全局注意力机制,这限制了其在视觉主干模型中的广泛应用。这一改变增强了DCNv4的动态特性并提高了性能表现。
2024-01-19 13:58:43
3878
4
原创 [即插即用]cvpr2023,部分卷积
为了设计快速的神经网络,许多工作都专注于减少浮点运算的数量(FLOPs)。然而,我们观察到,这种浮点运算数量的减少并不一定会导致延迟的相似水平降低。这主要是由于每秒浮点运算效率低下(FLOPS)。为了实现更快的网络,我们重新审视了流行的操作符,并证明这种低FLOPS主要是由于操作符频繁的内存访问,尤其是深度卷积。因此,我们提出了一种新的部分卷积(PConv),通过同时减少冗余计算和内存访问,更有效地提取空间特征。
2024-01-13 12:22:43
640
1
原创 Gold-YOLO: 基于集散机制的高效目标检测器
Gold-YOLO-N 在 COCO val2017数据集上获得了出色的39.9% AP,在 T4图形处理器上获得了1030 FPS,其表现优于以前的 SOTA 型 YOLOv6-3.0-N,具有类似的 FPS + 2.4%。本文在TopFormer的理论基础上,通过全局融合多层次特征并将全局信息注入到更高层次,提出了一种新颖的GD (gathering -and- distributed mechanism)机制来实现yolo中高效的信息交换。
2024-01-12 09:07:27
747
1
原创 scunet++:基于多融合密集跳跃连接的Swin-UNet和CNN瓶颈混合架构的肺栓塞CT图像分割
实验结果表明,所提方法在FUMPE数据集上获得了83.47%的Dice相似系数(DSC)和3.83的Hausdorff距离95百分位数(HD95),在CAD-PE数据集上获得了83.42%的DSC和5.10的HD95。通过与医学专业人士的合作,我们的团队细致地分析了公开可访问的FUMPE和CAD-PE数据集。该方法以CTPA图像为研究对象,结合unet++、多融合密集跳跃连接、Swin-Transformer注意力机制和SwinUNet方法的优点,并对网络进行了一些改进,以增强网络的分割精度和稳定性。
2024-01-10 13:10:23
1165
原创 Agent attention:关于Softmax和线性注意力的集成
注意力模块是transformer的关键组件。虽然全局注意力机制具有较高的表达能力,但其过高的计算成本限制了其在各种场景中的适用性。本文提出一种新的注意力范式——智能体注意力,以在计算效率和表示能力之间取得良好的平衡。具体来说,智能体注意力表示为一个四元组(Q, a, K, V),在传统的注意力模块中引入了一组额外的智能体token a。代理token首先充当查询token Q的代理,从K和V聚合信息,然后将信息广播回Q。
2024-01-09 08:53:37
1389
原创 MCANet,多尺度轴向注意力网络
标题:MCANet: Medical Image Segmentation with Multi-Scale Cross-Axis Attention。
2024-01-04 13:32:01
1737
1
原创 即插即用的下采样模块HWD,:一种简单有效的语义分割下采样模块
此外,为了研究HWD的好处,提出了一种新的度量,称为特征熵指数(FEI),它衡量在cnn中降采样后的信息不确定性程度。综合实验表明,所提出的HWD模块可以(1)有效地提高跨不同模态图像数据集的分割性能,以及(2)与传统的下采样方法相比,有效地降低信息不确定性。下采样操作,如最大池化或跨步卷积,在卷积神经网络(cnn)中被广泛使用,以聚合局部特征,扩大感受野,并最小化计算开销。然而,对于语义分割任务,局部邻域的特征池化可能会导致重要空间信息的丢失,而这有利于像素级预测。
2023-12-31 15:29:57
4986
1
原创 CSFN,实时语义分割的上下文和空间特征校准。即插即用融合特征
上下文建模或多层次特征融合方法已被证明是提高语义分割性能的有效方法。CSFCN包含两个核心模块:上下文特征校准(Context Feature Calibration, CFC)模块和空间特征校准(Spatial Feature Calibration, SFC)模块。CFC采用级联金字塔池化模块高效捕获嵌套上下文,然后根据像素-上下文相似度为每个像素聚合私有上下文,实现上下文特征校准。SFC沿着通道维度将特征分割为多组子特征,并通过可学习采样将子特征传播到其中,以实现空间特征校准。
2023-12-12 17:11:07
1842
原创 即插即用,图像去雨雪等
具体而言,SMGARN由3部分组成:Mask-Net、guide - fusion Network (GF-Net)和reconstruction - net。首先,构建自像素注意力(Self-pixel Attention, SA)和跨像素注意力(Cross-pixel Attention, CA)相结合的掩模网络来捕捉雪花特征并准确定位雪的位置,从而预测出准确的雪掩模;因此,不能有效地检测雪花/雪条会影响去雪效果,限制模型性能。总结:可以用的模块是:Mask-net,GF-Net,即插即用。
2023-12-07 16:37:49
327
1
原创 [即插即用] 一种实时精确的航空遥感河流冰语义分割模型
大多数情况下,图像中的浮冰大小不一、形状不规则,这就要求网络具有提取多尺度特征的能力。他们中的大多数会采用骨干ResNet , DeepLab , Transformer来提取有意义的特征。空间分支是卷积和非线性映射层的堆叠,以获取局部区域的细节信息。这会到达一个更复杂的分支,也更耗时。因此,为了加快分割速度,采用下采样和Ghost模块策略来降低上下文分支的分析代价。此外,由于河流冰图像中存在较多的小冰块,采用可学习的上采样策略DUpsampling代替常用的双线性插值,以提高分割精度,特别是小冰块。
2023-12-06 20:54:41
276
1
原创 [水论文]Refconv替换传统卷积,不增加计算负担,即插即用
作者从另一个角度来提高cnn的性能——增加现有结构的先验。例如,一个DW conv可以被认为是多个相互独立的2D转换核(称为核通道)的连接,特定的核通道的唯一输入是其特征图的对应通道(称为特征通道),这可能会限制模型的表示能力。本文寻求在不改变模型定义或引入任何推理成本的情况下添加更多先验(例如,让内核通道与其他特征通道一起操作,将使操作不再是DW转换),因此提出一种重新参数化技术,通过使其参数关注其他结构的参数来增加模型结构的先验。此外,RefConv还可以改善卷积网络在目标检测和语义分割方面的性能。
2023-12-01 15:06:12
3080
5
计算机视觉即插即用模块,部分卷积
2024-01-13
CFP文章的EVC模块即插即用
2023-12-02
计算机视觉方向,Refconv替换传统卷积,不增加计算负担,即插即用
2023-12-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人