自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 收藏
  • 关注

原创 【Arxiv 2025】重磅发布!全新傅里叶残差通道注意力模块FRCA,助显著性目标检测与跨模态融合,精准提升深度学习性能!

本文提出两种基于傅里叶变换的注意力模块FRCA和FG-RCA,用于解决RGB和热成像双模态显著性目标检测中的高频信息提取问题。FRCA通过傅里叶变换分离高频/低频信息,结合通道注意力机制优化特征;FG-RCA进一步引入门控机制和残差融合,增强跨模态特征交互。实验表明,这些模块能有效提升模型在复杂场景下的细节捕捉能力,同时降低计算复杂度。文章详细介绍了模块设计原理、适用场景,并提供即插即用代码实现。

2025-09-26 21:13:27 1102

原创 【ESWA 2025】震撼!轻量级神器 GS-HalfConv 横空出世:速度飙升,精度爆表,刷新移动端视觉新极限!

摘要:本文提出两种轻量级卷积模块CG-Half-Conv和GS-HalfConv,用于解决传统卷积计算量大、分组卷积信息孤岛等问题。CG-Half-Conv采用半卷积机制,仅对一半通道进行卷积,显著降低计算量;GS-HalfConv在此基础上增加通道打散、门控等创新设计,提升跨组信息交互能力。实验表明,这些模块在果蔬识别等轻量化任务中表现优异,FLOPs仅为传统卷积的1/4,同时保持较高精度,适合移动端部署。文章详细解析了模块原理、创新点及适用场景,并提供了即插即用代码。

2025-09-12 19:44:44 727

原创 【TCSVT 2025】CVPR级黑科技!CoDA模块横空出世:频域+跨门控加持,图像去噪和细节恢复全面碾压传统注意力!

本文提出WACAFRN网络用于图像去噪,核心贡献是自适应坐标注意力(ACA)模块。该模块通过方向分解与自适应缩放因子,有效捕捉噪声特征并保持细节,解决了传统方法难以精确定位噪声的问题。进一步提出改进版CoDA模块,引入频域门控和跨方向交互,增强对复杂噪声的适应性。两个模块均支持即插即用,适用于去噪、超分等多种视觉任务。实验表明,该方法在真实噪声去除和细节保持方面表现优异,特别是CoDA模块在深层网络中展现出更好的稳定性和恢复效果。

2025-09-11 09:45:00 1184 1

原创 【ICCV 2025】南京大学重磅突破!反卷积块-上采样平替:图像去噪、超分辨率、去模糊所有CV任务统统吊打传统上采样方法!

《反卷积及其在图像修复中的应用:B站CV缝合救星技术解析》 本文介绍了一种新型反卷积模块Converse2D及其改进版MSR-RevConv,可有效解决图像修复中的关键问题。研究团队针对转置卷积非严格逆运算、现有反卷积方法局限等痛点,提出深度可分逆卷积算子,通过正则化最小二乘优化实现高效反演。该技术在去噪、超分辨率和去模糊三大任务中展现出优越性能,其中MSR-RevConv模块还创新性地引入多尺度核融合、通道自适应正则化和残差增强机制,显著提升复杂场景下的恢复效果。该成果为深度模型提供了数学严谨且高效的可学

2025-09-10 19:30:56 1289

原创 【Arxiv 2025 预发行论文】可变形滑动窗口Attention (DSwin)上线!跨窗口交互一键搞定,细节建模能力狂飙!

摘要:论文提出DSwinAttention和HDNA两个创新模块,用于图像复原任务。DSwinAttention通过可变形滑动窗口机制解决传统窗口注意力边界受限问题,实现跨窗口交互和内容自适应建模。HDNA模块在此基础上融合层次偏移预测、局部邻域注意力和全局通道调制,增强对复杂纹理的建模能力。实验表明,这些模块在去雨、去雾、去噪等任务中性能优越,支持即插即用部署。研究有效结合了CNN的局部性和Transformer的全局性,为图像处理提供了新思路。

2025-09-08 14:32:08 1074

原创 【CVPR 2025】北大&中科院联合出品!新爆款PAF-DC:相位感知频率动态卷积,轻量也能碾压SOTA,全场景涨点神器!

CVPR2025顶会论文《频率动态卷积用于密集图像预测》:提出创新FD-Conv模块,通过频率解耦权重、空间精细调制和频带动态调整,在语义分割、目标检测等任务中实现高效轻量化的频率多样性建模。相比传统动态卷积,仅增加3.6M参数就能显著提升性能,支持主流架构无缝嵌入。文章提供模块解析、创新思路及适用任务说明,并附源码获取方式,帮助读者理解这一CV领域的突破性成果。

2025-09-07 22:03:47 658

原创 【Arxiv 2025 预发行论文】重磅突破!STAR-DSSA 模块横空出世:显著性+拓扑双重加持,小目标、大场景统统拿下!

摘要:DSSAU-Net提出一种用于耻骨联合与胎儿头部分割的U型混合网络,核心创新是双稀疏选择注意力(DSSA)模块。该模块通过区域级和像素级双重稀疏筛选降低计算复杂度,结合局部上下文增强提升低对比度目标的分割精度。增强版STAR-DSSA进一步引入显著性加权和拓扑偏置,优化细粒度结构建模。实验表明,该方法在医疗超声分割任务中兼顾效率与精度,适用于资源受限场景。

2025-09-05 12:04:32 979

原创 【ICCV 2025 顶会论文】,新突破!卷积化自注意力 ConvAttn 模块,即插即用,显著降低计算量和内存开销。

【论文摘要】ICCV 2025论文《用卷积模拟自注意力的高效图像超分辨率方法》提出ConvAttn模块,通过共享大核(13×13)模拟自注意力长程依赖,结合动态小核(3×3)实现输入自适应,显著降低内存开销(较自注意力减少85%)。创新性提出MiLK-ConvAttn增强模块,引入大核字典路由、动态局部聚合和双路径软门控机制,在超分辨率任务中PSNR提升0.3dB的同时延迟降低40%,适用于移动端图像增强、医学影像等轻量化场景。该工作为注意力机制的高效实现提供了新思路。

2025-09-04 22:48:28 1277

原创 【CVPR 2025】 清华大学新作:见大观小,LS卷积横扫CV任务!

CVPR2025顶会论文研究:LSNet提出创新的大-小卷积模块(LS-Conv),模仿人类视觉系统的见大观小"机制,通过大核静态感知与小核动态聚合相结合,在轻量化模型中同时实现广域上下文建模和局部细节捕捉。研究还提出增强版DCLSConv模块,整合多尺度感知、小核动态聚合和通道注意力三重机制,显著提升轻量化网络在分类、检测和分割等任务中的表现。文章包含模块原理图解、适用任务分析及代码获取方式,为CV领域提供高效的特征提取解决方案。

2025-09-02 10:58:01 958

原创 【TGRS 2025 】 多尺度自注意力模块 MSAM,一插就涨点!

【摘要】本文介绍了一种基于自注意力机制和状态空间模型的轻量级语义分割网络(MSAM模块),用于高效城市场景分割。该网络通过跨尺度自注意力建模、辅助通道信息补充和轻量化设计,解决了单尺度全局信息不足、固定感受野局限等问题。实验表明,MSAM模块能有效提升复杂场景下的分割性能,尤其适用于遥感图像中的小目标检测和边界识别。同时提供即插即用的CSAGBlock模块代码,支持多模态任务中的跨尺度特征融合。两个模块均具有轻量、易集成特点,可嵌入主流分割网络提升性能。

2025-09-01 12:04:31 1395

原创 【2025年 Arxiv 即插即用】 特征融合新突破:空间–光谱注意力融合模块 SAFFM 强势登场!

【摘要】 本文提出两种创新模块用于遥感影像融合任务:SAFFM(空间-光谱注意力特征融合模块)和XMSGF(跨模态多尺度引导融合模块)。SAFFM通过多尺度卷积(3×3/5×5/7×7)与空间-光谱引导图协同优化,解决全色锐化中空间-光谱失真的问题;XMSGF则引入跨模态注意力机制和相似度一致性调制,适配多模态任务。实验表明,二者在保持光谱保真度的同时显著提升空间细节表现,且具备轻量化、可插拔特性。SAFFM适用于单模态全色锐化,XMSGF更擅长跨模态特征对齐,为遥感影像处理提供高效解决方案。代码已开源,支

2025-08-14 17:07:32 850

原创 【IJCV 2025】 傅里叶调制注意力FMA:低成本,高性能,全局信息一网打尽!

摘要:本文提出了一种轻量级图像超分辨率网络SRConvNet,采用Transformer风格的卷积结构,核心创新是傅里叶调制注意力机制(FMA)。该模块通过频域操作降低计算复杂度,同时保持全局建模能力,在性能和效率间取得平衡。FMA Plus版本进一步引入窗口化处理、频域门控等技术,增强局部细节表现。实验表明该方法在超分辨率任务中优于现有轻量级模型,适用于高分辨率重建、医学影像处理等场景。文章提供了模块原理详解、创新思路和适用任务分析。

2025-08-08 11:06:27 1025

原创 [TIP 2025] 轻量级光谱注意力LSA,极致优化,减少99.8%参数,提升性能!

提出轻量级光谱注意力模块(LSA)解决传统光谱去马赛克问题。该模块通过分离空间和通道注意力,在减少参数量的同时提升计算效率和图像质量,适用于医学影像、遥感处理等场景。创新性地采用动态门控融合和通道混洗技术,在无监督学习中实现高效特征提取。实验表明,LSA模块在资源受限设备上仍能保持优异性能,为计算机视觉任务提供轻量化解决方案。

2025-08-07 16:53:43 1066

原创 【TGRS 2025】多组通道-空间注意力模块 M-CBAM,全面提升视觉任务表现,助力模型精准飞跃!

📌 Group CBAM Enhancer 聚焦于“局部显著信息提取”与“关键特征增强”的联合设计,其核心由以下三个关键特点构成:① 分组处理提升局部注意力感知:将输入特征沿通道维度均匀分组,每个子组独立应用 CBAM 注意力模块,分别获取各组的局部显著信息,有效捕获不同通道区域的关键特征。② 权重重分配进一步强化关键信息:对每组 CBAM 输出的注意力权重进行重新调整,将高于均值的权重直接置为 1,低于均值的保持原值,从而强调最重要的特征区域,提升模型判别力。③ 残差连接保持原始信息与增强特

2025-07-02 09:06:20 1280

原创 【TGRS 2025】MSC 模块上线,多尺度稀疏融合让模型表现一飞冲天!

📌 Multiscale Sparse Cross-Attention 聚焦于“多尺度融合”与“冗余抑制”的联合设计,其核心由以下三个关键特点构成:① 多尺度池化提取丰富上下文信息:通过在低层特征上使用不同大小的平均池化窗口,获取多尺度结构信息,从细节到整体均有覆盖,为后续注意力计算提供多层次特征输入。② TopK 稀疏交叉注意力降低干扰,突出关键信息:将高层特征作为 Query,低层多尺度特征作为 Key/Value,通过 TopK 筛选仅保留与 Query 高度相关的部分,去除大量无关干扰信息

2025-06-28 22:04:11 1609

原创 【2025年 即插即用】Transformer Attention 已过时?试试这个「分组残差注意力」模块!

📌 Compact-enhanced 自注意力机制聚焦于“效率优化”与“细节建模”的融合设计,其核心由以下三个关键特点构成:① 下采样采样器显著降低计算开销:CESA 首先通过平均池化对输入特征进行下采样,降低空间维度并扩大感受野,使得后续注意力计算成本从 O(N²) 降为 O(C²),大幅提升运行效率,特别适用于高分辨率图像处理场景。② 通道划分与值交叉提升跨维建模能力:通过通道分组后分别生成Query/Key/Value,采用创新性的 Value 交换式多头注意力机制,增强不同通道之间的信息交

2025-06-18 22:59:32 1203

原创 【arXiv 2025】仅一行代码接入!全新激活函数 TeLU 横空出世,轻松替代现有激活函数,性能全面领先!

📌 TeLU 激活函数设计聚焦于“快速收敛”与“数值稳定性”的兼顾优化,其核心由以下三个关键特点构成:① 指数调制提升非线性表达能力:TeLU 通过引入指数函数与双曲正切变换的组合,设计出形式为 TeLU(x) = x·tanh(eˣ) 的激活函数,使激活响应在正值区快速接近恒等映射,在负值区平滑饱和,具备更强的函数表达能力。② 连续可导保障梯度传播稳定性:相比于 ReLU 的非连续性,TeLU 在整个定义域内连续可导,避免梯度消失或不连续带来的训练不稳定问题,有利于深层网络的高效训练。

2025-06-17 20:18:45 1961

原创 【2025年 即插即用】Transformer Attention 已过时?试试这个「分组残差注意力」模块!

📌 GRSA 模块设计聚焦于“分组注意力降维建模”与“轻量级残差信息增强”,其核心由以下三个关键步骤构成:① 组内注意力低开销建模:GRSA 将输入特征按通道分组,在每组内独立进行自注意力计算,仅建模局部通道内的相关性,有效降低了全局注意力的计算成本和显存开销。② 残差路径增强深层特征学习:每个通道组内引入残差连接,避免信息丢失并促进梯度传递,使得注意力模块在不增加额外参数的情况下仍能提升建模深度与细节恢复能力。③ 高效融合实现结构与细节统一表达:所有分组注意力输出经整合后与主干特征融合,既保

2025-06-16 20:07:26 1200

原创 【AAAI 2025】特征增强新突破!FCM 模块即插即用,精准锁定小目标,检测精度稳步提升!

💡 解决思路(FCM 核心贡献)① 通道-空间双分支拆分:输入特征按比例分为通道语义分支与空间位置分支,实现语义与位置信息的显式解耦。② 互补映射机制:设计通道交互与空间交互两条路径,生成权重 ω₁、ω₂,双向注入,缓解空间-语义失配。

2025-06-13 16:47:29 1905

原创 【ICASSP 2025】全新升级!注意力 × 卷积融合模块来了,一键插入模型,性能直接起飞!

📌 ACFM 模块设计聚焦于“局部-全局联合建模”与“低开销特征增强”,其核心由以下三个关键步骤构成:① 局部分支建模局部纹理特征:在局部分支中,ACFM 引入 1×1 卷积与 Channel Shuffle 操作,结合深度可分离卷积模块,有效提升模型的特征表达能力,增强对边缘与纹理细节的捕捉能力。② 全局分支捕获远距离依赖:全局路径采用 轻量注意力机制,利用 1×1 卷积 + 3×3 深度卷积生成 Query、Key、Value,通过特征维度内的自注意力运算,建模图像中长程依赖,强化语义信息的全

2025-06-08 22:49:34 1428

原创 【arXiv 2025 最新】频域注意力模块上线:轻松插拔,性能拉满!

《FMNet:频域辅助的轻量级伪装目标检测网络》 摘要:本文提出了FMNet网络,通过频域注意力机制解决传统伪装目标检测方法存在的三大问题:局部建模能力不足、Transformer计算复杂度高和频率信息利用不充分。创新性地设计了频率-空间融合机制,包含多尺度频率辅助Mamba线性注意力模块(MFM)和频域残差增强模块(FWM),将注意力复杂度从O(H²W²D)降至O(HWD)。实验表明,该方法在大/小目标、遮挡场景下均表现出色,可广泛应用于医学影像、遥感分割等需要精细边缘检测的任务。文末提供了即插即用模块F

2025-06-05 00:26:50 2403 1

原创 【TPAMI 2025】重磅来袭!全新 MSA 掩码分离注意力,分割模型涨点利器,精度再突破!

① 目标难区分:伪装目标与背景在外观上极度相似,导致传统注意力机制难以准确分离前景与背景区域,容易造成目标漏检或误分割。② 全局建模泛化差:常规 Transformer 中所有注意力头作用一致,缺乏功能分工,难以同时兼顾区域内聚焦与区域间对比。

2025-05-27 20:58:23 1072 1

原创 【2025年 即插即用】双坐标注意力机制上线:轻量设计,即插即用,2025新款强势涨点!

🌧️ 存在的问题(背景动因)① 局部感知限制:传统卷积操作由于空间不变性,难以捕捉全局上下文与长距离依赖,导致花卉图像中复杂结构信息提取不足。② 注意力缺陷:现有注意力机制多忽视空间位置信息,仅对通道间关系建模,难以精准定位图像中的关键区域。③ 信息丢失:单一平均池化在聚合特征时容易造成显著细节模糊,影响特征判别性,尤其在背景复杂或光照不均的场景中表现不佳。    💡 解决思路(DCAFE 核心贡献)① 双通道坐标注意力融合:DCAFE 引入并行的平均池化与最大池化方式,增强特征图中

2025-05-26 07:58:52 1508

原创 (2025年 CVPR) 频域增强 × 多尺度建模!轻量还原神器 FusedEnhanceBlock 来了!

💡 解决思路(EBlock 核心贡献)① 空间频域融合增强:EBlock 同时融合空间域的多尺度膨胀卷积与频域 MLP 调制,在保留局部细节的同时增强全局结构建模能力,有效应对模糊与照度变化。② 轻量化门控机制:引入SimpleGate 乘性门控结构,在提升特征表达非线性的同时保持计算开销较低,替代传统复杂的注意力机制。③ 归一化与残差耦合设计:采用双 LayerNorm 与 Learnable 残差系数(β、γ)增强训练稳定性和特征调控能力,保

2025-05-20 22:44:34 1359

原创 【CVPR 2025】Geometry Self-Attention:即插即用的结构感知模块,显著提升语义分割与视觉理解精度!

本文提出了一种新颖的思路:不再显式编码深度图特征,而是利用其构造图像patch之间的几何关系矩阵,引导注意力权重的空间分配。 通过构建一个融合空间位置与深度差异的几何先验,并引入至自注意力机制中,模型可以自动聚焦于几何相关区域,从而在不引入额外复杂度的前提下,显著提升RGB-D语义理解能力。该方法兼顾性能与效率,为RGB-D语义分割提供了全新的研究范式。

2025-05-04 20:30:42 3129 1

原创 【AAAI 2025】SNN也能频域建模?FSTA-SNN快速时空注意力模块震撼登场!

本文提出了一种高效的频域时空注意力模块(Frequency-based Spatial-Temporal Attention, FSTA),通过频域分析浅层和深层脉冲输出特征,引导网络在保持学习偏好的同时,有效压制冗余脉冲特征。具体做法是在每个网络层内引入基于离散余弦变换(DCT)的空间注意力模块与时间注意力模块,以提升脉冲特征表达能力并降低能耗,同时引入尺度调节因子避免特征损失,从而在不显著增加计算复杂度的前提下,实现性能和能效的双重提升。

2025-04-29 23:56:09 1187

原创 【CVPR 2025】状态空间还可以这样写?EVSS-Win 跨平台解锁非局部视觉建模!

本文提出了一种高效的空间扫描模块(Efficient Visual Scan, EVS),在每个SSM模块前引入几何变换(如翻转与转置),替代多方向扫描策略,仅通过单方向扫描即可捕获非局部空间信息,从而在不显著增加计算复杂度的前提下,有效提升图像恢复质量。该模块充分利用SSM的高效性,同时增强了模型对视觉数据空间结构的建模能力。

2025-04-29 23:53:02 1803

原创 【WACV 2025】前馈结构还能这样改?SEFN 模块精准建模空间依赖!

本文提出了一种空间增强前馈网络(Spatially-Enhanced Feedforward Network, SEFN),通过融合浅层空间信息与深层特征表达,有效提升模型在空间结构建模与区域一致性保持方面的能力:结构保持: 在前馈网络中显式引入空间门控机制,增强特征的区域感知能力;上下文协同: 结合图像前后状态,通过特征对齐与注意调节,强化结构连贯性与上下文一致性。该模块兼顾效率与表达力,为基于状态空间建模的图像修复网络提供了强有力的空间信息补充机制,特别适用于需要高保真结构恢复的

2025-04-29 23:49:55 1451

原创 【TCSVT 2025】边缘高斯聚合模块 EGA:目标检测再登 SOTA

EGA 模块通过“高斯建模 + 边缘增强 + 残差融合”的三阶段设计,成功在结构保持与特征增强之间找到平衡点,特别适用于目标检测、图像分割等对边缘敏感的视觉任务。作为一个轻量、模块化的设计,EGA 可灵活集成至主干网络中,为模型带来更强的鲁棒性与表达能力。

2025-04-29 23:38:48 2307

原创 【CVPR 2025】突破微调极限,轻装上阵——涨点神器 Mona:小巧·强大·高效!

本文提出了一种高效的多认知视觉适配器(Multi-cognitive Visual Adapter, Mona),通过引入可调整输入分布的归一化模块与多尺度卷积感知单元,提升适配器对视觉特征的处理能力。具体做法是:在适配器中融合多个深度可分离卷积(3×3、5×5、7×7)构建多认知滤波器组,同时采用加权归一化优化固定层输入特征分布,强化不同尺度、不同认知视角下的特征提取与融合能力。Mona模块作为核心微调单元,广泛验证于图像分类、目标检测、语义分割、实例分割与定向目标检测等任务,在多个代表性视觉基准测试中首

2025-04-29 23:32:43 2753 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除