自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(141)
  • 收藏
  • 关注

原创 (即插即用模块-Attention部分) 六十五、(2024 WACV) DLKA 可变形大核注意力

CNN 在提取局部细节方面表现出色,但缺乏捕捉全局信息的机制。而现有的分割方法要么依赖于 CNN 的局部信息提取能力,要么使用 Transformer 的全局信息捕捉能力,缺乏两者之间的平衡。这篇论文在LKA的基础上提出一种。: 尽管 Transformer 在捕捉全局信息方面表现出色,但其计算量随 token 数量的平方增长,限制了其深度和分辨率能力。, D-LKA 模块结合了 LKA 和可变形卷积的优势,能够在保证计算效率的同时,更好地捕捉局部和全局信息。

2025-05-05 10:00:00 1021

原创 (即插即用模块-Attention部分) 六十四、(2024) LSKA 可分离大核注意力

VAN 中的 LKA 通过直接使用深度可分离卷积层的大卷积核,导致计算量随卷积核尺寸的增大而呈二次增长,导致模型效率低下。此外,虽然使用深度可分离卷积层的小卷积核和扩张卷积层的大卷积核组合,缓解了计算量增长的问题,但参数量仍然随卷积核尺寸的增大而增长,限制了模型在极端大卷积核下的使用。具体来说,LSKA 将深度可分离卷积层的大卷积核分解为水平方向和垂直方向的 1D 卷积核,并依次进行卷积操作,最终得到与 LKA 相同的输出结果。

2025-05-04 10:45:00 780

原创 (即插即用模块-Attention部分) 六十三、(2024 CVPR) MLKA 多尺度大核注意力

为了解决如何有效地建立不同区域之间的长距离相关性,并避免由于大卷积核带来的“块效应”问题。这篇论文在 LKA 的基础上提出了一种。,MLKA 的设计动机是为了解决图像超分辨率任务中,MLKA 结合了 大卷积核分解 和 多尺度机制 来实现这一目标。

2025-05-03 09:45:00 533

原创 (即插即用模块-Attention部分) 六十二、(2022) LKA 大核注意力

自注意力机制在 NLP 领域取得了巨大成功,但其应用于计算机视觉任务时存在三个主要问题:将图像视为一维序列,忽略了其二维结构;计算复杂度为二次方,难以处理高分辨率图像;只考虑了空间维度上的适应性,忽略了通道维度上的适应性。而卷积操作虽然能够利用局部上下文信息,但缺乏适应性。:获取通道维度上的关系。通过上述分解,LKA 能够以较低的计算成本和参数数量捕获长距离关系,并生成注意力图,从而实现自适应调整输出。:获取长距离依赖关系、:获取局部结构信息、

2025-05-02 10:00:00 429

原创 (即插即用模块-Attention部分) 六十一、(2024 ACCV) LIA 基于局部重要性的注意力

旨在保证性能的前提下,降低计算复杂度,实现高效的 2-order 信息交互。: 利用局部重要性生成注意力图,对特征图进行加权,增强重要信息,抑制无关信息。: 计算复杂度高,运行速度慢,不适合轻量级 SR 模型。: 通过计算每个像素周围区域的局部重要性,识别图像中关键信息的位置。: 性能较弱,无法充分利用图像信息。

2025-05-01 11:30:00 846

原创 (即插即用模块-特征处理部分) 四十五、(2024 TGRS) SFF 浅层特征融合模块

SFF 模块的核心思想是利用卷积神经网络 (CNN) 的局部感知能力,分别提取不同模态数据的浅层特征,并进行融合。SFF 模块可以降低对 DSM 数据的依赖,即使在缺少 DSM 数据的情况下,也能取得较好的分割效果。,SFF 模块通过融合浅层特征,可以更好地保留物体细节,例如形状、边界、颜色和纹理等,从而提高分割精度。:现有的多模态融合方法通常只关注深层特征融合,忽略了浅层特征中包含的丰富细节信息。:不同模态数据之间存在统计特性和噪声水平的差异,直接融合可能会导致信息丢失或混淆。

2025-04-30 10:00:00 418

原创 (即插即用模块-特征处理部分) 四十四、(2024 TGRS) FEM 特征增强模块

应用扩张卷积获取更丰富的局部上下文信息,从而更好地理解小目标的周围环境。遥感图像中,小目标的特征通常很微弱,且容易受到背景干扰。: 利用多分支结构提取更多具有判别性的语义信息;

2025-04-29 15:50:54 384

原创 (即插即用模块-特征处理部分) 四十三、(2024 TGRS) EFC 增强特征修正融合策略

其是一种轻量级的特征融合策略,旨在解决无人机图像中小目标检测的挑战。它通过增强特征之间的相关性来提升检测精度,同时减少计算资源消耗。:传统的FPN融合方法(如拼接或相加)无法充分利用多尺度特征融合的优势,导致特征之间相关性不足,难以有效检测小目标。:无人机硬件资源有限,需要降低模型复杂度,提高检测效率。为此,这篇论文提出一种。:无人机图像中小目标分辨率低,特征信息有限,容易被背景噪声掩盖。

2025-04-28 10:00:00 770

原创 (即插即用模块-特征处理部分) 四十二、(2024 TPAMI) FreqFusion 频率特征融合

低分辨率特征在降采样过程中会丢失高频细节信息,导致边界模糊,影响目标定位精度。所以这篇论文提出一种利用频率域分析来优化特征融合过程。: 由于物体内部不同区域特征差异较大,简单上采样和插值会导致特征在物体内部变化剧烈,导致类内相似度降低,影响分类准确率。

2025-04-27 21:30:36 668

原创 (即插即用模块-特征处理部分) 四十一、(2024) MSAA 多尺度注意力聚合模块

UNet 等模型中常用的跳连接方式,将低层特征图直接加到高层特征图上,无法有效融合不同尺度的信息,限制了分割效果的提升。: 遥感图像分割需要考虑不同尺度的信息,例如大尺度信息可以提供全局场景理解,小尺度信息可以捕捉细节特征。,MSAA 模块旨在通过聚合不同尺度的特征,从而更好地捕捉多尺度上下文信息。

2025-04-23 21:27:16 851

原创 (即插即用模块-特征处理部分) 四十、(2024) MAFM&MCM 特征融合+特征解码

RGB 图像中包含丰富的纹理信息和细节,但易受光照变化和复杂背景的影响。而深度图像包含丰富的空间结构信息,可以帮助区分前景和背景,但缺乏细节信息。为了充分利用 RGB 和深度图像的互补信息,需要有效地融合不同模态的特征,同时降低模型的计算复杂度。,MCM 采用残差结构,包含多个卷积块。其通过融合不同尺度的特征图,可以提高解码器的学习和泛化能力。此外,逐步生成包含丰富细节的噪点目标预测图,这篇论文提出一种。

2025-04-20 10:00:00 841

原创 (即插即用模块-特征处理部分) 三十九、(2024) LAE & MSFM 特征提取+匹配模块

传统的卷积操作会丢失边缘和角落的像素信息,而这些信息在医学图像中非常重要,因为它代表了 ROI 目标与其周围区域之间的隐含信息。邻近像素之间存在信息差异,目标像素包含的信息熵高于其邻近像素,因此在采样过程中希望保留信息含量更高的像素。所以这篇论文提出一种。医学图像中的 ROI 通常与周围区域存在空间上的关联,例如肿瘤与周围组织的浸润现象。传统的多尺度特征融合方法主要依赖于通道信息的交换,而忽略了空间信息的重要性。

2025-04-19 10:00:00 1201

原创 (即插即用模块-特征处理部分) 三十八、(2024) LSK Block 大型选择性内核块

遥感图像中的目标识别往往需要考虑其周围环境,以便准确区分不同类别。例如,船只和车辆的外观可能相似,但周围环境可以提供区分两者的线索。同时,不同目标所需的上下文信息差异很大: 例如,足球场由于独特的边界线,所需的上下文信息相对较少,而环形建筑则可能需要更多的上下文信息来区分花园和建筑。为了解决以上这两个挑战,这篇论文提出一种。,LSK Block 采用了一种动态调整感受野的方法,使其能够根据不同目标的上下文信息需求进行自适应调整。

2025-04-18 10:00:00 629

原创 (即插即用模块-特征处理部分) 三十七、(2024 ICLR) MOGA 多阶门控聚合层

现代卷积神经网络的表达力瓶颈: 尽管现代卷积神经网络在视觉任务中取得了优异的性能,但它们在编码特征交互方面存在缺陷。多阶博弈论交互的启示: 多阶博弈论交互可以分析神经网络中不同阶数的特征交互,并发现它们在不同类型的神经网络中的分布情况。研究表明,现有的深度神经网络倾向于编码过多低阶或高阶交互,而忽略了中间阶数的交互,这限制了其表达力。:使用 SiLU 激活函数作为门控分支,实现类似 Sigmoid 的门控效果和稳定的训练特性。然后使用 1x1 卷积将输入特征和Y的输出进行连接,并通过门控分支进行聚合。

2025-04-17 10:15:00 566

原创 (即插即用模块-特征处理部分) 三十六、(2024) HFF 层次特征融合模块

医学图像分类任务中,需要同时提取局部空间特征和全局语义信息,而单一网络结构难以兼顾两者。现有融合方法如 ViTAE、StoHisNet 等,虽然取得了不错的效果,但在医学图像领域表现不佳,可能是因为医学图像数据量小、特征分散,难以有效学习。所以这篇论文提出一种。

2025-04-16 10:00:00 865

原创 (即插即用模块-特征处理部分) 三十五、(2024) FFM 特征融合模块

CNN 和 Transformer 分别擅长于提取局部特征和全局上下文信息,但单独使用存在局限性。CNN 捕获的局部特征细节丰富,但难以建模长距离依赖关系。而Transformer 善于建模长距离依赖关系,但容易受到复杂背景的干扰。所以为了更好融合两部分的特征,这篇论文提出一种。其目的是有效地融合 CNN 编码器和 Transformer 编码器提取的中间特征,以便更好地进行裂纹分割。

2025-04-15 13:57:08 1021

原创 (即插即用模块-特征处理部分) 三十四、(ECCV 2024) FFCM 融合傅里叶卷积混合器

当前图像去雨方法主要依赖空间域操作,如自注意力机制,进行全局建模,导致计算量巨大且效率低下。频率域特征可以有效地提取雨痕的密度和方向信息,并将其与图像内容分离,具有建模长距离信息的能力。,FFCM 通过融合空间域和频率域的特征,实现了高效的全局建模。此外,频率域特征能够自然地提取全局信息,而卷积操作则保证了局部信息的保留。

2025-04-14 11:58:40 582

原创 (即插即用模块-特征处理部分) 三十三、(2024) DFF 动态特征融合模块

现有的特征融合方法,如直接拼接或简单的卷积,缺乏对全局信息的利用,导致融合后的特征不够鲁棒。而动态机制可以自适应地选择重要的特征,从而提高融合效果。所以这篇论文提出一种。,DFF 模块通过动态机制,根据全局信息自适应地融合多尺度局部特征。: 根据全局通道信息,选择重要的特征图,并保留信息量大的特征,丢弃信息量小的特征。: 根据全局空间信息,对融合后的特征图进行校准,突出重要的空间区域。

2025-04-14 11:57:50 505

原创 (即插即用模块-特征处理部分) 三十二、(TGRS 2024) MDAF 多尺度双表示对齐过滤器

频率域特征和空间域特征分别捕捉图像的不同方面和属性,但它们之间存在语义差异。需要一种方法来对齐两者的语义,并选择更具代表性的特征进行融合。:设计了 DAF (Dual-Representation Alignment Filter) 结构,利用交叉注意力机制实现语义对齐和特征选择。通过查询对方及其自身的键值对计算注意力,并进行特征加权,最终实现特征选择。:使用不同尺度的竖条卷积对频率域特征和空间域特征进行处理。将处理后的特征拼接并进行 1x1 卷积,得到统一尺度的矩阵 Q, K, V 作为输入。

2025-04-13 21:14:01 633

原创 (即插即用模块-特征处理部分) 三十一、(2024) CDFA 对比度驱动的特征聚合模块

医学图像中普遍存在共现现象,例如内镜息肉图像中,大小相似的息肉往往会同时出现。现有模型容易学习到与目标实体本身无关的共现特征,导致在目标实体单独出现时无法准确预测。,CDFA 模块是 ConDSeg 框架中用于克服医学图像分割中“共现”现象的关键模块。它通过引导多尺度特征融合和关键特征增强,从而帮助模型更好地区分目标实体和复杂背景环境。CDFA 模块通过利用解耦出的前景和背景特征,引导多尺度特征融合。通过对比前景和背景特征,CDFA 模块能够增强关键特征,从而帮助模型更好地区分目标实体和背景。

2025-04-13 21:12:22 834

原创 10种涨点即插即用模块 卷积 合集篇(二)!!!(附原文地址+论文+代码)

同时,小核卷积无法有效扩大感受野, 减小卷积核尺寸可以提高速度,但会限制模型的感受野,导致性能下降。扩张卷积在扩大感受野的同时,也降低了频率响应,导致高频信息丢失,出现混叠现象,影响模型性能。传统的扩张卷积使用全局固定的扩张率,无法适应不同区域的频率特征,限制了模型的表达能力。所以,这篇论文提出一种。在现有的研究中, 作者观察到随着CNN网络深度的增加,优化后的CNN通常会产生高度相关的滤波器。: FFC 模型中的 1x1 卷积仅计算相同频率的特征,而忽略了不同频率之间的关系,难以捕捉复杂内容。

2025-04-09 16:56:54 1063

原创 10种涨点即插即用模块 卷积 合集篇来啦(一)!!!(附原文地址+论文+代码)

所以,这篇论文中引入了一种 重参数化重聚焦卷积(Re-parameterized Refocusing Convolution),其通过利用预训练参数中编码的表示作为先验并重新聚焦于它们来学习新的表示来增强现有模型结构的先验,从而进一步增强预训练模型的表示能力。为了解决现有的局部感受野的局限性,即 现有的 CNN 模型大多采用小尺寸卷积核,导致感受野较小,难以捕捉图像中相距较远的特征信息,这对于需要全局上下文的任务(如人体姿态估计)来说是不够的。: 动态卷积会显著增加模型参数量,从而影响模型大小和效率。

2025-04-09 16:54:43 1181

原创 (即插即用模块-Convolution部分) 二十、(2020 CVPR) SPConv

现有的模型压缩方法主要关注减少不重要滤波器或构建高效操作,而忽略了特征图中的模式冗余。许多特征图在层内共享相似但不完全相同的模式,但难以确定具有相似模式的特征是否冗余或包含重要细节。这篇论文提出一种 SPConv, SPConv 通过将输入特征图拆分为代表性部分和冗余部分来减少 vanilla 卷积中的冗余。代表性部分通过相对复杂的 k×k 卷积来提取内在信息。冗余部分通过轻量级的 1×1 卷积来处理细微的隐藏差异。最后使用参数免费的融合模块来重新校准和融合这两组处理后的特征。

2025-04-09 16:51:22 500

原创 (即插即用模块-Convolution部分) 十九、(2022 CVPR) TVConv

许多视觉任务(如人脸识别、医疗图像分割)具有特定的布局,即图像内部(空间)变化大,而图像之间变化小。同时,静态卷积忽略了布局信息,而动态卷积计算量过大,不适合布局感知应用。:TVConv 使用权重生成块根据亲和图生成权重,可以自由地进行过参数化,提高空间适应性,同时保持推理速度。:TVConv 使用亲和图来表示像素对之间的关系,类似于注意力机制,但更高效。:TVConv 的权重在不同位置是不同的,能够更好地适应图像的局部特征。:TVConv 的权重在所有图像中共享,避免了重复计算,提高了效率。

2025-04-09 16:50:33 1019

原创 10种涨点即插即用模块 特征处理合集篇(六)!!!(附原文地址+论文+代码)

其创新性地引入了一组额外的令牌A的注意三元组(Q,K,V),并产生一种表示为四元组(Q,A,K,V)的代理注意力将代理令牌A的附加集合引入到传统注意力模块中。代理令牌首先充当查询令牌Q的代理,以聚集来自K和V的信息,然后将该信息广播回Q。虽然两者的组合更有利于发挥各自的优势,但通道和空间注意力之间的协同作用尚未得到充分探索,还缺乏充分利用多语义信息的协同潜力,所以,论文提出一种新的。在先前的线性注意力的研究中,像是采用深度卷积来保持特征多样性的方法虽然是有效的,但它们仍存在线性注意力有限的表达能力问题。

2025-03-31 17:59:01 1044

原创 10种涨点即插即用模块 特征处理合集篇(五)!!!(附原文地址+论文+代码)

在现有的研究当中,CNN和传统注意力机制都存在着一定的局限性: 即虽然CNN 在图像识别等领域取得了显著成果,但其计算复杂度和参数数量仍然很高,限制了其在资源受限设备上的应用,现有的注意力机制(如 SE-Net, CBAM 等)虽然能够有效提升特征表达能力,但其计算复杂度和参数数量也相对较高,不适合轻量级 CNN。而子空间学习却有着以下优势: 子空间学习通过将特征图划分为多个子空间,可以分别学习每个子空间的注意力图,可以有效地捕捉不同尺度和不同频率的特征信息,从而提升特征表达能力。所以,这篇论文提出一种。

2025-03-31 17:56:36 810

原创 10种涨点即插即用模块 特征处理合集篇(四)!!!(附原文地址+论文+代码)

在现有的自注意力机制中,其建模长距离依赖关系方面表现出色,但其计算复杂度和内存需求巨大,限制了其在实际应用中的使用。例如,背景中的纹理信息可能会干扰模型的判断。FA 的核心思想是通过结合 通道注意力 (CA) 和 像素注意力 (PA) 机制,为不同类型的信息处理提供额外的灵活性,并扩展 CNN 的表示能力。现有的 Transformer 存在一些局限性: Transformer 在提取全局特征方面表现出色,但其注意力机制主要关注单向的序列关系,难以捕捉图像中复杂的空间和通道特征。所以,这篇论文提出一种。

2025-03-31 17:54:05 855

原创 10种涨点即插即用模块 注意力 合集篇(三)!!!(附原文地址+论文+代码)

论文首先分析了目前大多数现有的设计都是直接利用二维特征映射上的自注意力来获得基于每个空间位置上的孤立查询和关键字对的注意矩阵,而没有充分利用相邻关键字之间的丰富上下文信息。论文中分析到在浅层全局注意力机制中,注意力矩阵呈现出局部性和稀疏性的特点,这意味着浅层网络中大部分远距离 patch 之间在语义建模上是无关的,因此全局注意力机制存在大量冗余计算。: 现有的高分辨率密集预测模型往往依赖于复杂的模型结构,例如 softmax 注意力机制、大卷积核等,这会导致计算成本高昂,难以在硬件设备上部署。

2025-03-26 16:44:16 1084

原创 10种涨点即插即用模块 注意力 合集篇(二)!!!(附原文地址+论文+代码)

为此,论文提出了一种新的非局部注意力,即 Fully Attention,通过在一个单一的相似性映射编码空间和通道的注意力来解决之前的问题,同时还能保持高的计算效率。与现有的通道和空间注意力模块相比,SimAM 实现了在不向原始网络添加参数的情况下,为层中的特征图推断3D层面上的注意力权重,并且这种注意力更加灵活,并且轻量化。为了弥补 点积注意力 的这一缺陷,论文提出了一种新的高效注意力机制(Efficient Attention),EA 与 点积注意力 等价,但具有更少的计算开销。

2025-03-26 16:41:46 768

原创 10种涨点即插即用模块 注意力 合集篇来啦(一)!!!(附原文地址+论文+代码)

因此,作者提出了一种新的移动网络的注意力机制,即在通道注意力中嵌入位置信息,称为“坐标注意力”。相当经典的一种通道注意力,在这项工作中,作者专注于通道的关系,提出了一种“Squeeze-and-Excitation (挤压和激励)”块,用来自适应重新校准通道的功能响应明确建模通道之间的相互依赖关系。这篇论文首先分析了 SE 通道注意力所存在的不足,如 SE 通道注意力只考虑在通道关系的层面来权衡每个通道的重要性,但忽略了位置信息对于生成空间选择性注意力图也是很重要的一个因素。

2025-03-21 17:43:19 909

原创 10种涨点即插即用模块 特征处理合集篇(三)!!!(附原文地址+论文+代码)

传统的特征融合方法无法有效区分目标变化和非目标变化以及无法有效融合不同尺度的特征图,这就使得现有的研究容易受到非目标变化的干扰、检测结果的细节信息丢失或语义信息不准确,最终导致变化检测结果不准确。论文论证道:变化检测任务需要同时关注变化区域的语义信息和空间细节信息,同时不同尺度的特征图包含不同的信息,如高层特征图语义信息丰富但空间细节信息丢失,低层特征图空间细节信息丰富但语义信息丢失。DASI 模块的目的是根据目标的大小和特征,自适应地选择合适的特征进行融合,从而更好地保留目标信息并增强目标的显著性。

2025-03-19 11:00:00 994

原创 10种涨点即插即用模块 特征处理合集篇(二)!!!(附原文地址+论文+代码)

在现有的研究中,随着层数的增加,GNN 和 Transformer 的性能往往会下降,这是因为学到的特征表示会趋同,导致模型无法区分不同的输入。此外,在现有的过度平滑分析方法中,主要集中在表示收敛到一个点的情况,而忽略了更普遍的维度崩溃情况,即表示在嵌入空间中形成一个狭窄的锥体,导致表达能力的损失。拼接后的特征图依赖于网络的学习能力进行信息融合,容易引入噪声;传统的上下文建模方法通常将固定的区域内的上下文信息聚合起来,忽略了不同像素对上下文需求的差异,导致像素与上下文之间的不匹配,从而影响分割精度。

2025-03-18 14:34:11 862

原创 10种涨点即插即用模块 特征处理合集篇(一)!!!(附原文地址+论文+代码)

所以,为了解决这个问题,BCN首先沿(N, H, W)轴计算平均值和方差,然后沿(C, H, W)轴计算,最后根据自适应参数ι将归一化输出进行组合。ASPP 的主要原理是基于以下几点:多尺度信息的重要性: 不同的物体尺度需要不同大小的感受野来捕捉特征。而 ASPP 则通过并行地使用不同膨胀率的空洞卷积,可以在不改变特征图分辨率的情况下,有效地获取不同尺度的上下文信息。ACmix 的核心原理:ACmix 通过将输入特征图投影到更深的特征空间,然后使用不同的聚合操作分别处理这些中间特征。

2025-03-15 14:00:29 1048

原创 (即插即用模块-Convolution部分) 十八、(2024 CVPR) FADConv 频率自适应空洞卷积

扩张卷积在扩大感受野的同时,也降低了频率响应,导致高频信息丢失,出现混叠现象,影响模型性能。传统的扩张卷积使用全局固定的扩张率,无法适应不同区域的频率特征,限制了模型的表达能力。:通过空间变权重的策略平衡特征图中的高低频成分,抑制背景和物体中心的高频成分,鼓励 FADConv 使用更大的扩张率,从而扩大感受野。:将卷积核权重分解为低频和高频成分,并动态调整它们的比例,提高卷积核的频率响应,扩大有效带宽。FADConv 主要从频率分析的角度出发,提出了三种策略来改进扩张卷积,具体来说,

2025-03-13 10:00:00 1067

原创 (即插即用模块-Convolution部分) 十七、(2024 ECCV) WTConv 小波变换卷积

视觉Transformer (ViT) 的自注意力机制能够进行全局特征混合,而卷积神经网络 (CNN) 受限于局部混合。为了弥补这一差距,一些研究尝试增加 CNN 的卷积核大小,但很快达到上限并饱和。现有方法要么参数量过大,要么难以扩展到全局感受野。所以这篇论文提出一种。WTConv 通过利用小波变换 (WT) 将输入分解成不同频率的分量。对每个频率分量分别进行小核卷积,每个卷积关注不同的频率范围。

2025-03-12 10:00:00 1304

原创 (即插即用模块-Convolution部分) 十六、(2024 CVPR) IDConv Inception深度卷积

大核深度可分离卷积效率低下,尽管大核深度可分离卷积的 FLOPs 较低,但其内存访问成本高,在强大计算设备上(如 GPU)成为瓶颈。同时,小核卷积无法有效扩大感受野, 减小卷积核尺寸可以提高速度,但会限制模型的感受野,导致性能下降。IDConv 受 Inception 思想启发,将大核深度可分离卷积分解为多个并行分支,包括:小方核分支、正交带核分支以及恒等映射分支: 保持部分通道不变,避免信息丢失。,通过保留部分通道不变,仅对部分通道进行处理来达到更好的效果。

2025-03-11 10:00:00 1832

原创 (即插即用模块-Convolution部分) 十五、(2024) LDConv 线性可变形卷积

LDConv 提出了一个算法来生成任意大小卷积核的初始采样坐标,并通过偏移量调整采样形状,使其能够适应目标形状的变化。同时,LDConv 允许卷积核具有任意数量的参数,例如 1, 2, 3, 4, 5, 6, 7 等,从而为网络设计提供了更多灵活性。最后,LDConv 将参数数量的增长趋势从平方变为线性,从而降低了对硬件环境的要求。标准卷积操作通常使用固定形状的正方形核,无法适应目标形状的变化。所以这篇论文提出一种。,其源于对标准卷积操作的局限性认识,旨在提升卷积神经网络在目标检测等任务中的性能。

2025-03-10 10:00:00 850

原创 (即插即用模块-特征处理部分) 三十、(2024) BFAM & CBM & DFEM 特征聚合+特征提取+边界感知

在遥感图像变化检测中,边界信息对于准确识别变化区域至关重要。现有的方法往往忽略了边界信息与变化信息之间的关系,导致边界特征提取能力不足,影响检测精度。CBM 利用边界信息来辅助提取变化区域特征,其通过边缘增强操作,强化边界信息,使其在特征图中更加突出。此外,CBM 学习如何更好地利用边界信息来定位变化区域,并指导其他模块进行特征解耦。现有的方法往往由于特征解耦过程的信息损失,导致高级语义信息不足。然后利用残差操作融合特征信息,并提取更深层次的高层次语义特征。B2CNet 论文中提出的。

2025-03-09 10:00:00 2066

原创 (即插即用模块-特征处理部分) 二十九、(2024) CAFM 卷积注意力融合模块

CAFM 的基本思想是将卷积和注意力机制结合,卷积操作擅长捕捉局部特征,但难以建模全局特征和长距离依赖关系。: 注意力机制擅长提取全局特征,但忽略了局部特征,例如像素之间的空间相邻关系。论文考虑到卷积和注意力机制在特征建模方面具有互补性,结合两者可以更全面地捕捉HSI的局部和全局特征,所以提出一种。: 卷积操作擅长捕捉局部特征,但感受野有限,难以建模长距离依赖关系,例如空间上相隔较远的像素之间的关联性。: HSI包含丰富的空间和光谱信息,仅依靠卷积或注意力机制难以充分建模其复杂的特征。

2025-03-08 10:00:00 954

原创 (即插即用模块-特征处理部分) 二十八、(2024 AAAI) GAU 门控注意力单元

直接编码在每个时间步重复生成相同的浮点数,导致脉冲表示缺乏时间动态,无法有效模拟人类视觉系统对动态视觉信息的处理。: 由于缺乏时间动态,直接编码生成的脉冲表示信息量有限,导致 SNN 参数敏感性较高,性能受限。: 直接编码需要大量时间步才能维持高性能,导致模拟时间和能耗增加。为此,这篇论文提出一种。GAU 通过利用多维度注意力机制进行门控,将静态数据高效地编码为具有时间动态的强大表示。现阶段直接编码存在一些局限性:即。

2025-03-07 10:00:00 601

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除