- 博客(43)
- 收藏
- 关注
原创 【AAAI 2026】即插即用 Spikingformer 重构残差连接,打造高效脉冲 Transformer
本文针对现有脉冲 Transformer 中由于 SEW 残差连接导致的非脉冲计算瓶颈,提出了一种名为 Spikingformer 的新型全脉冲架构。通过引入 MS 残差连接,Spikingformer 确保了网络各层之间传递的是纯粹的二值脉冲信号,从而在硬件实现上仅需低功耗的加法器(AC)。该模型在计算机视觉和自然语言处理的多个基准测试中均展现了卓越的性能。
2026-01-06 15:30:10
955
原创 TGRS 2025 | 高频提取模块HFE:小波变换“即插即用”,性能飙升新利器!
针对遥感图像(RSIs)由于传感器限制导致的低分辨率、细节丢失及结构复杂等问题,本文提出了一种新型的小波引导与特征感知超分辨率网络(WFA-SRNet)。现有方法往往难以有效保留对下游任务(如目标检测、场景分类)至关重要的高频细节,且仅依赖低分辨率(LR)输入信息限制了结构细节的恢复。WFA-SRNet 采用双分支架构,分别通过特征提取模块(FEB)和高频提取模块(HFE)协同建模语义结构与细粒度纹理。前者结合移窗交叉注意力(SWCA)与字典相似性匹配策略捕捉非局部自相似性;
2026-01-05 11:39:57
851
原创 即插即用还涨点!ICCV 2025 LEG:边缘-高斯-双注意力,非常涨点的三重增强轻量模块,显著提升视觉任务性能
遥感图像目标检测()任务常受到低空间分辨率、传感器噪声、运动模糊及不利光照等多重降质因素的困扰。这些因素削弱了目标的特征独特性,导致表示模糊和前景-背景分离困难。现有方法,特别是轻量化模型,在处理低质量目标时表现出局限性。为应对这些挑战,本文提出了一种名为的轻量级骨干网络,其核心是新颖的来锐化模糊或低对比度目标中易于丢失的关键边缘细节,并利用来抑制噪声、规整模糊的特征响应,从而在挑战性条件下增强前景的显著性。本文的主要贡献在于:1)提出了EGA模块,有效应对低质量遥感图像中的特征退化问题;
2025-12-03 14:44:24
844
原创 即插即用,涨点神器!AAAI 2026模块MHCB+DPA:特征提取+双池化注意力,无需魔改结构,性能显著提升
遥感图像在军事、资源勘探等领域应用广泛,但单一传感器难以同时获取高空间分辨率和高光谱分辨率的图像。全色(PAN)图像空间分辨率高但为灰度,多光谱(MS)图像色彩丰富但空间分辨率低。现有方法通常将图像**超分辨率(Super-Resolution, SR)**与图像着色作为独立任务处理,前者无法提升光谱信息,后者无法提升空间细节,而全色锐化等融合方法又需要配准的图像对作为输入。为解决这一困境,本文提出了一种名为的多功能网络。该网络构建于 UNet++ 架构之上,创新性地集成。
2025-12-01 11:45:55
1080
原创 即插即用!AAAI 2025 DDI模块发布,双MLP实现跨尺度信息融合
时间序列预测(Time Series Forecasting, TSF)领域的主流方法,如基于Transformer和MLP的模型,在处理现实世界中复杂的时间序列数据时面临各自的挑战。真实世界的时间序列通常在不同尺度上展现出多样的模式,而未来的变化正是由这些重叠尺度的相互作用共同决定的。Transformer模型虽擅长捕捉长程依赖,但计算复杂度高且易过拟合;MLP模型虽计算高效,却难以有效捕获复杂尺度下的时间模式。
2025-11-27 13:59:52
816
原创 SCI一区,即插即用!SCSA协同注意力机制:小目标检测与低光照增强的通用涨点方案
现有研究虽已证明通道与空间注意力的结合能提升视觉任务性能,但两者间的,特别是在空间信息如何指导通道特征学习以及如何缓解多语义信息带来的差异方面,仍缺乏深入探讨。现有即插即用注意力机制普遍存在两大局限:一是对固有的多语义空间信息利用不足,无法有效引导关键特征提取;二是对多语义融合带来的处理不当。为应对这些挑战,本文提出了一种新颖的)模块。该方法旨在探索空间与通道注意力在多语义层面的协同关系。SCSA由一个)模块和一个)模块串联而成。
2025-11-25 11:33:59
752
原创 【CVPR 2025】即插即用LAMA:线性注意力+双局部增强,以O(N)复杂度平替Mamba
图像复原(IR)是计算机视觉的关键领域。近年来,研究范式从感受野受限的CNN和计算复杂的Transformer,转向了选择性状态空间模型(Mamba)。然而,Mamba固有的一维扫描(one-dimensional scanning)机制难以有效处理图像中的多向空间关联,并且其递归计算降低了效率。针对这些挑战,本文利用线性注意力(Linear Attention)与Mamba中SSM的数学相似性,提出了一种名为ACL的新型图像复原模型。
2025-11-21 11:41:41
630
原创 【CVPR 2025】即插即用EfficientViM:新架构让视觉Mamba快得离谱,速度精度双碾压!
为了在资源受限的环境中部署神经网络,以往的研究通过结合卷积(捕获局部依赖)和注意力机制(捕获全局依赖)来构建轻量级架构。然而,注意力机制的二次方计算复杂度成为其效率瓶颈。近期,**状态空间模型(State Space Model, SSM)**因其在处理长序列时具有线性计算复杂度的优势而备受关注。尽管如此,现有的视觉Mamba模型在实际应用中速度仍不及顶尖的轻量级模型,其主要瓶颈在于对输入序列的线性投射操作。针对这一挑战,本文提出了一个全新的高效视觉Mamba架构——EfficientViM。
2025-11-19 11:52:58
1104
原创 【AAAI 2026 Oral】告别单一路径,即插即用LWGA模型,提出四种注意力并行新机制,多尺度特征捕捉能力拉满
遥感(RS)图像分析的效率受到两大冗余问题的制约:一是广阔同质背景导致的(spatial redundancy),二是目标尺度极端变化导致的现有的轻量化网络模型多为自然图像设计,难以同时应对遥感图像的这两个挑战,常常在保留局部细节和捕捉全局上下文之间顾此失彼。为解决此问题,本文提出了一个专为遥感视觉任务设计的轻量级骨干网络——LWGANet。该网络通过两个核心创新应对上述挑战:1)Top-K全局特征交互(TGFI)模块,通过聚焦于显著区域进行计算,有效缓解了空间冗余;
2025-11-17 14:05:51
1068
原创 即插即用!CVPR 2025颠覆性模块SKC,双交叉注意力实现高效涨点
在医学图像分析领域,由于标注数据稀缺,半监督学习(SSL)已成为主流范式。然而,传统SSL方法在生成伪标签时,容易因标签不准确而损害解码器的性能,这一问题在类别不均衡的多器官分割任务中尤为突出,常导致小器官被欠分割甚至忽略。为应对此挑战,本文提出了SKCDF(A Semantic Knowledge Complementarity based Decoupling Framework),一个基于语义知识互补的解耦框架。该方法的核心思想是:首先,通过。
2025-11-12 13:56:44
1074
原创 【ICCV 2025】即插即用合成图表数据集ECD问世,开源MLLM图表理解性能飙升!
图表理解是构建有效科学智能体的核心,然而现有的,特别是开源模型,在复杂基准测试上的成功率仅为30%-50%,表现不佳。现有研究通过合成图表数据对模型进行微调,但这些数据与真实图表的相似度不足,限制了模型在复杂真实场景下的性能。为应对此挑战,本文提出了一种高效的图表数据合成方法。该方法将图表生成过程模块化,通过一个五步流水线设计——分离数据与绘图函数、条件化生成多子图、视觉多样化、质量过滤及问答对生成——来创建。该数据集包含超过1万张图像和30万个问答对,覆盖29种图表类型和250多种组合。
2025-11-07 14:30:47
556
原创 【CVPR 2025】FDConv:从频率域重新思考动态卷积,即插即用,高效涨点
传统的通过注意力机制结合多个并行权重,以实现自适应的权重选择,但这些权重在频率响应上高度相似,导致参数冗余且适应性受限。为解决这一挑战,本文提出了。该方法在傅里叶域中学习一组固定的参数预算,并将其划分为具有不相交傅里叶索引的频率组,从而在不增加参数成本的前提下构建出具有显著频率差异的权重。为进一步增强适应性,论文引入了和。KSM在空间层面动态调整每个滤波器的频率响应,而FBM则根据局部内容对不同频带进行动态调制。
2025-11-06 14:23:35
691
原创 【CVPR 2025】知识蒸馏总被特征冗余拖后腿?DFS用“动态选择”让模型轻装上阵,效率飙升!
视觉是一项关键的视觉任务,但现有方法大多为特定领域(如工业场景)设计,导致其跨领域泛化能力受限。这一挑战主要源于不同领域间固有的特征差异,以及预训练网络带来的领域偏差。为解决此问题,本文提出了,一个通用的统一异常检测框架。该框架基于学生-教师模型,通过引入,引导学生模型学习具有领域先验知识的代表性特征。同时,设计的与**裕度损失(Margin Loss)**增强了模型区分正常与异常样本的能力。最后,一个被用于动态评估异常分数,以实现鲁棒的检测。
2025-11-05 15:19:19
815
原创 告别大核卷积!ICCV 2025重磅研究RFA:多层中核卷积实现更大感受野,稳定涨点
卷积神经网络(ConvNets)领域为实现长距离依赖建模,逐渐转向大卷积核设计。然而,现有的大核ConvNets虽然扩大了,但普遍面临参数量与计算成本高昂,以及破坏ERF的渐进高斯分布(Asymptotically Gaussian Distribution, AGD)等挑战。AGD现象表明,对输出像素而言,输入图像中邻近像素应具备更高权重,而现有大核模型常违背此直觉。本文提出了一种新的范式:通过合理组合多种较小尺寸的卷积核(如7×7, 9×9, 11×11),在扩大ERF的同时维持其AGD特性。
2025-11-04 14:10:16
982
原创 双注意力卷出新高度!CVPR 2025 CASAB模块:轻量设计,大幅提升模型鲁棒性
医学图像中的生物标志物(biomarker)分割对于生物技术应用与疾病诊断至关重要。然而,现有方法(包括基于CNN和Transformer的模型)在处理染色和形态变化时常表现不佳,且在小样本医学数据集上难以高效地从编码器向解码器传递多尺度特征。针对解码器效率低下的挑战,本文提出了一种新颖的解码器架构——多尺度卷积注意力与深度-空间恢复(MCADS)。
2025-11-03 14:50:30
1019
原创 告别冗余!AAAI 2025 HFP模块:即插即用的双路DCT设计,在多个任务上实现SOTA
其设计灵感来源于传统图像处理:微小目标的边缘、纹理等细节信息主要对应频域中的高频分量,而大面积的平滑背景则对应低频分量。从图4可以看出,原始特征图(左)中,微小目标的响应非常微弱,几乎淹没在背景中。经过HFP模块处理后(右),目标的特征响应被显著增强,轮廓更加清晰,与背景的区分度也更高。HS-FPN的整体结构与FPN相似,保留了自底向上和自顶向下的双路径设计。SDP通过在局部区域内精确匹配高低层特征,有效缓解了因上采样导致的像素不对齐问题,并利用高层特征丰富的语义信息来指导和丰富低层的微小目标特征。
2025-10-31 15:10:26
765
原创 【CVPR 2025】即插即用GBC模块:小体积,大能量,重塑特征提取新范式
针对结构裂缝像素级分割任务中,现有方法难以在分割质量与计算资源消耗之间取得平衡的挑战,本文提出了一种名为SCSegamba的轻量级结构感知视觉Mamba网络。传统CNN方法因感受野受限,难以建模大范围不规则依赖;而Transformer方法虽能捕捉长程依赖,但其二次方计算复杂度导致模型庞大,难以部署。为解决这些问题,SCSegamba利用选择性状态空间模型 (Selective State Space Models, SSMs)的线性计算复杂度优势,并进行针对性优化。本文的核心创新在于设计了。
2025-10-30 14:33:27
662
原创 【CVPR】计算量骤降,性能反升!南大FFTformer频域碾压传统Transformer,拿下SOTA
针对在图像去模糊任务中因带来的二次方计算复杂度问题,本文提出了一种高效的频域解决方案。传统方法通过降采样或窗口化来降低计算量,但常导致信息损失。本文基于卷积定理,即空间域的卷积等效于频率域的逐元素乘积,设计了频域自注意力求解器 (FSAS),将矩阵乘法替换为高效的逐元素操作,显著降低了计算和空间复杂度。此外,为解决标准在特征提炼上的不足,本文受JPEG压缩算法启发,提出了判别式频域前馈网络 (DFFN),通过可学习的门控机制自适应地保留或抑制不同频率分量。
2025-10-29 16:42:28
873
原创 【IEEE 2025】即插即用 SRMF 突破长尾困境!实现超高分辨率遥感图像的精准分割
超高分辨率(UHR)卫星图像的语义分割技术在灾害管理、城市规划和环境监测等领域至关重要。然而,UHR图像普遍存在严重的类别不平衡,即“长尾分布”现象:少数类别(如建筑、农田)占据绝大多数像素,而大部分类别(如池塘、车站)样本稀少。这种分布导致模型训练时梯度更新被头类主导,对尾类特征学习不足,严重影响分割精度。现有UHR分割方法多聚焦于设计多分支网络以提取和融合多尺度特征,但普遍忽略了从数据层面解决长尾问题。针对这一挑战,框架被提出。该方法创新性地从“数据增强”和“多模态融合。
2025-10-28 14:36:18
1089
原创 【NeurIPS 25】即插即用,破解LLM推理两大难题,难度偏差与熵崩塌迎刃而解
本文通过对 GRPO 的深刻洞察,提出了一个更具原则性的判别式约束优化框架 DisCO。该框架不仅从根本上解决了 GRPO 的“难题偏见”,还通过一系列精心设计的技术(如非裁剪评分函数、约束优化、DRO)成功克服了现有方法的训练不稳定和数据不平衡问题,最终在多个数学推理基准上实现了显著的性能飞跃,为强化学习优化大型推理模型提供了新的SOTA方法。个人思考 (My Thoughts):研究思路的启发。
2025-10-27 13:58:32
1002
原创 【AAAI 2025】卷积与Transformer大一统!M-WSAttention让图像恢复效果焕然一新
在自监督图像去噪(SSID)领域,盲点网络(Blind-Spot Network, BSN)是一种主流架构。然而,现有BSN多基于卷积(CNN)实现,其在捕获长距离依赖方面存在固有局限。尽管Transformer在多种图像恢复任务中展现了超越CNN的潜力,但其核心的自注意力机制可能与BSN严格的“盲点约束”相冲突,导致模型直接“看到”并学习输入噪声,从而限制了其在SSID中的应用。本文系统性地分析并重新设计了Transformer中的通道和空间自注意力机制,使其适配盲点约束。针对通道注意力。
2025-10-24 14:12:10
849
原创 【AAAI 2025】即插即用的低频DCT特征提取模块,代码已开源
论文提出,图像篡改检测(IML)不应局限于微观层面的伪造痕迹(如噪声、边缘不连续),也需关注宏观层面的语义改变(如物体替换、场景结构异常)。受物理学中介于宏观与微观之间的“中观(Mesoscopic)”概念启发,本文将图像篡改定位问题重新定义为一项**“中观尺度”**的任务,即协同分析微观细节与宏观语义,并构建了一个名为Mesorch的全新混合架构以实现这一目标。论文明确指出,现有研究或专注于CNN捕捉的微观伪造痕迹,或依赖Transformer理解的宏观语义,但两者往往是割裂的。
2025-10-23 14:51:58
892
原创 CCF-A顶会研究:用轻量CNN实现自注意力,即插即用、性能不减、效率倍增
雨痕的物理特性(如形状、密度、与光照的交互)和空间分布具有高度的复杂性,常常与背景纹理产生混叠,使得该问题呈现出严重的病态性(ill-posed nature)。,用于在注意力矩阵中仅保留Top-k个最重要的值,从而实现自适应的稀疏计算。大量的实验证明,CPRAformer在多个图像去雨和去雾基准上均达到了最先进的性能,为未来的图像恢复研究提供了新的思路和强大的基线模型。,旨在创建一个统一的框架,高效地整合、对齐并融合来自不同范式的特征,从而实现更鲁棒和精细的图像去雨效果。其整体架构如下图所示。
2025-10-22 14:51:35
1170
原创 15.5分SCI一区力荐:跨通道状态空间模型CSI,即插即用!
本研究提出的SAMamba框架,通过将SAM2的强大分层表示能力和Mamba的高效长程依赖建模能力相结合,并辅以针对性的FS-Adapter、CSI和DPCF模块,成功地应对了红外小目标检测中的核心挑战。尽管性能优越,SAMamba在某些极端场景下仍存在局限,例如在高度复杂的背景纹理(如密集的云层边缘)中,目标与背景的特征区分度依然很低,可能导致漏检(如下图7所示)。为应对上述挑战,SAMamba设计了一个U-Net形态的编码器-解码器架构,并集成了三个创新的核心模块。消融研究系统地验证了每个模块的贡献。
2025-10-21 14:05:32
788
原创 【ECCV】EASA轻量即插即用,让CNN“看见”Transformer级全局视野
SMFANet通过其精心设计的SMFA模块,巧妙地结合了近似全局建模(EASA)和局部细节捕捉(LDE),并通过创新的方差调制机制提升了结构感知的准确性。同时,PCFN模块在保证特征交互的同时,极致地优化了计算效率。这些设计共同使得SMFANet在轻量级图像超分辨率领域中,成为一个兼具高精度、高速度和低资源消耗的强大解决方案,尤其适用于移动端和边缘计算等资源受限的应用场景。
2025-10-20 12:05:36
1102
原创 【CVPR】即插即用SCConv:新一代卷积模块,显著提升CNN效率与性能
卷积神经网络(CNNs)在计算机视觉领域取得了显著成功,但这通常以巨大的计算和存储资源为代价。一个关键原因是卷积层在提取特征的过程中产生了大量的空间(spatial)和通道(channel)冗余。现有工作大多只关注其中一个维度的冗余,未能系统性地解决问题。针对此,该论文提出了一种高效的即插即用卷积模块——SCConv(Spatial and Channel reconstruction Convolution),旨在通过双维度重构,同时减少特征图中的空间与通道冗余,从而在降低计算复杂度的同时,提升模型的特征
2025-10-17 13:58:24
1214
原创 【NeurIPS 2025】刷屏预警!南洋理工&上海 AILab 的 PhysX-3D,让3D资产从“虚拟壳子“变“物理实体“!
属性分类逻辑:将物体属性按“识别-功能-操作”三个递进阶段划分,假设组件内部构成均匀、属性一致,避免标注歧义。具体属性内容识别阶段:标注绝对尺度、材料(含名称、杨氏模量、泊松比、密度);功能阶段:分析功能可用性(对所有零件按被触碰优先级评1-10分)、功能描述(基础描述、功能描述、运动学描述);操作阶段:量化运动学参数,定义6类运动类型(无约束、移动关节、旋转关节、铰链关节、刚性关节、旋转-移动组合关节),除无约束和刚性关节外,需标注父子零件及运动方向、范围、位置等细节;
2025-10-15 10:51:11
1092
原创 【AAAI 2025】涨点神器+1!即插即用的DCTSA模块,让你的小模型更“懂”空间关系
该研究首次从频率域的视角系统地分析了脉冲神经网络(SNN)的学习特性,并基于此提出了一种即插即用、轻量级的基于频率的时空注意力(FSTA)模块。该模块旨在通过抑制冗余的脉冲发放、强化有效的时空特征,从而在不显著增加能耗的前提下,提升 SNN 的性能并降低其脉冲发放率。
2025-10-14 11:54:34
666
原创 【TGRS 2025】尺度感知金字塔池化SCPP:即插即用的多尺度特征增强模块
遥感图像(RSI)的语义分割在深度神经网络的推动下取得了显著进展,特别是结合了卷积神经网络(CNN)的局部特征提取能力与Transformer的全局信息建模优势。然而,CNN在长距离建模上的固有局限性以及Transformer的高计算复杂度,使得遥感语义分割在处理光照、阴影等因素引起的严重空洞、边缘粗糙、误检及漏检等问题时仍面临挑战。为解决这些问题,本文提出了一种名为GLVMamba的视觉状态空间(VSS)模型。
2025-10-13 12:05:22
910
原创 【CVPR 2025】即插即用!SADA:尺度自适应可变形注意力,动态聚焦关键特征
本文提出的SADT模型,通过创新的尺度增强可变形卷积(SEDC)和尺度自适应可变形注意力(SADA),成功地解决了图像修复中去除结构化伪影的挑战。SADT在实现卓越性能的同时,保持了相对较低的模型复杂度和计算量。结果表明,SADA模块的引入带来了0.78dB的显著PSNR提升,而SEDC模块的加入进一步贡献了0.17dB的增益,证明了这两个创新模块对于模型性能至关重要。SADT的设计兼顾了高性能与低复杂度,为图像修复领域提供了一个通用且高效的解决方案,展现了其在现实世界应用中的巨大潜力。
2025-10-11 11:31:18
628
原创 【ICCV 2025】即插即用MANO:重塑注意力,多极驱动让CV模型「全面升维」
Transformer架构已在自然语言处理、计算机视觉乃至科学计算等领域取得了巨大成功。然而,其核心的自注意力(Self-Attention)机制存在一个固有瓶颈:计算复杂度和内存消耗随输入序列长度(例如,图像像素或网格点数N)呈二次方增长,即O(N²)。这一特性严重制约了Transformer在高分辨率图像处理、流体动力学模拟等密集预测任务中的应用,因为这些任务往往涉及海量的输入点。本研究成功地提出了一种名为MANO的高效注意力机制。
2025-10-10 11:32:14
681
原创 即插即用!CVPR 2025开源“涨点利器”:自适应频率选择机制
该论文针对近红外(NIR)图像辅助的RGB图像去噪任务,提出了一个名为跨域频率相关性利用网络(FCENet)的全新框架。其核心思想源于一个关键的发现:在频域中,噪声RGB图像与纯净NIR图像相对于目标纯净RGB图像存在互补优势。具体来说,噪声RGB图像在低频部分(色彩、结构)与纯净图像更相似,而NIR图像则在高频部分(纹理、细节)与纯净图像更为接近。基于这一“跨域频率相关性先验。
2025-10-09 11:08:57
872
原创 告别计算瓶颈!KBS‘24 即插即用高效加性注意力Transformer,为实时移动视觉而生
该研究针对标准自注意力机制(Self-Attention)在移动端应用中存在的二次方计算复杂度瓶颈,提出了一种名为 高效加性注意力(Efficient Additive Attention) 的新机制。其核心贡献在于:为了更好地理解 SwiftFormer 的创新,我们首先回顾几种注意力机制的设计。该机制的具体计算过程如下:输入的特征 经过线性变换得到 Query (Q) 和 Key (K)。Query 矩阵 与一个可学习的参数向量 相乘,得到注意力权重 。基于注意力权重 对 进行加权池化,生成
2025-09-30 11:21:48
751
原创 【arXiv 2025】多尺度线性注意力登场,CNN-Transformer混合架构实现医学分割新SOTA
一篇发表于2025年的论文《MSLAU-Net: A Hybird CNN-Transformer Network for Medical Image Segmentation》提出了一种新颖的混合CNN-Transformer架构——MSLAU-Net。该网络旨在结合卷积神经网络(CNN)强大的局部特征提取能力与Transformer卓越的全局依赖建模能力,同时通过创新的注意力机制解决计算效率问题,从而在医学图像分割任务中实现高精度与高效率的平衡。
2025-09-29 14:35:48
741
原创 CVPR 即插即用!高效频域Transformer开源:高质量图像去模糊SOTA方案
这篇论文提出了一种创新的、高效的图像去模糊方法,该方法将Transformer的特性在频域中进行探索与应用。该研究的核心思想源于卷积定理,即空间域中的卷积运算等效于频率域中的逐元素乘积。
2025-09-28 12:01:49
883
原创 一区 TOP 开源,即插即用的残差小波频域单元
红外成像系统因其工作机制和列信号读出方式,常受到条纹噪声的干扰。现有多数基于深度学习的去条纹方法,尤其是在采用U形网络结构时,面临两大核心挑战:为解决上述问题,论文提出了一种非对称采样校正网络(Asymmetric Sampling Correction Network, ASCNet)。其核心思想是:构建一个非对称的U形编解码框架,通过创新的下采样器、无偏的上采样器以及全局列特征校正模块,实现连续的列语义建模和全面的全局列关系表征,从而精确地解耦条纹噪声与图像背景。论文颠覆了传统U形网络中对称的采样(如下
2025-09-26 11:50:06
753
原创 【ICCV 2025】轻量化Mamba for Edge-SR: 一种即插即用的低秩与蒸馏方案
1生成式人工智能,特别是图像超分辨率(SR)技术,在各类视觉应用中需求旺盛。然而,在算力、内存和功耗受限的边缘设备上部署高效的SR模型仍然是一个重大挑战。为解决此问题,该论文提出了,一个专为边缘计算设计的轻量级图像超分辨率模型。该模型创新性地将Vision Mamba架构中的选择性状态空间(SSM)与低秩分解、知识蒸馏相结合,旨在功耗和参数量之间,实现卓越的平衡,同时维持高质量的图像重建效果。
2025-09-25 11:35:19
707
原创 【AAAI 2025】即插即用盲点网络(BSN),刷新自监督图像去噪SOTA
哈尔滨工业大学 (Junyi Li, Zhilu Zhang, and Wangmeng Zuo)核心概要自监督图像去噪 (Self-Supervised Image Denoising, SSID) 的核心在于构建盲点网络 (Blind-Spot Network, BSN),即在训练中严格避免网络观测到待预测像素点的真实值。传统上,这一领域由卷积神经网络 (CNN) 主导。此项研究首次系统性地探索并构建了一个完全基于Transformer的盲点网络——。
2025-09-24 12:18:18
979
原创 【AAAI 2025】永久开源,针对空洞卷积的即插即用CBR模块,实现高效性能提升
核心概要医学图像分割任务的核心挑战在于如何平衡对精细局部边界的捕捉与对复杂全局解剖结构的理解。针对此问题,该研究提出了一种名为MSA²Net的新型深度学习架构。其核心思想在于,通过设计一个创新的多尺度自适应空间注意力门 (Multi-scale Adaptive Spatial Attention Gate, MASAG),并将其嵌入到一个混合式的CNN-Transformer编解码器结构中,使网络能够在特征融合阶段(即跳跃连接处)动态地、自适应地调整其感受野。
2025-09-23 15:05:46
906
原创 【CVPR 2024】轻量即插即用!高效局部-全局特征融合模块开源发布
本文提出一种将单张图像去雾与场景深度估计相结合的双任务学习框架。其核心机制在于,构建一个协同互促的闭环系统,使深度信息与去雾过程能够双向引导、相互精炼。通过这种联合优化,旨在克服传统方法中信息单向流动的局限性,从而提升去雾模型的性能与泛化能力。图片。
2025-09-22 16:19:20
1281
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅