Revisiting Image Deblurring with an Efficient ConvNet论文阅读

1. 研究目标与实际意义

1.1 研究目标

论文旨在解决高分辨率图像去模糊任务中 Transformer 架构计算成本过高的问题,同时克服传统 CNN 感受野有限的缺陷。核心目标是设计一种轻量化的纯卷积网络(CNN),在保持高效性的同时实现与 Transformer 相当的性能。

引用原文
“We propose a unified lightweight CNN network that features a large effective receptive field (ERF) and demonstrates comparable or even better performance than Transformers while bearing less computational costs.”

1.2 实际意义
  1. 移动端应用:高分辨率图像去模糊在智能手机摄影、安防监控和自动驾驶等领域有广泛应用。降低计算成本(如参数量和 MACs)可推动算法在边缘设备的部署。
  2. 算法效率瓶颈:Transformer 的自注意力机制(MHSA)计算复杂度随分辨率呈二次方增长(O(n²)),难以处理高分辨率输入(如 4K 图像)。
  3. 产业价值:提升去模糊效率可增强图像质量,辅助下游任务(如目标检测、文本识别)。

2. 创新方法:LaKDNet 架构与核心设计

2.1 核心思路:大核卷积与空间-通道解耦

图2
图 2:LaKDNet 架构

论文提出 LaKD(Large Kernel Depth-wise)模块,核心创新在于:

  • 大核深度可分离卷积(Large Kernel Depth-wise Convolution):
    采用 9×9 或更大的卷积核(远超传统 3×3设计),显式扩大 有效感受野(Effective Receptive Field, ERF),模拟 Transformer 的全局依赖建模能力。
  • 空间-通道解耦混合机制(Spatial-Channel Decoupled Mixing):
    将特征处理分解为 空间混合(大核卷积)和 通道混合1×1 点卷积),避免标准 3D 卷积的计算冗余。

原文依据
“Our key design is an efficient CNN block dubbed LaKD, equipped with a large kernel depth-wise convolution and spatial-channel mixing structure, attaining comparable or larger ERF than Transformers but with a smaller parameter scale.”

2.2 网络架构:对称 U-Net 与层级化 LaKD 模块

整体结构为 4 层编码器-解码器(U-Net 架构),每层含 N 个 LaKD 模块(图 2):

  • 特征混合模块(Feature Mixer):
    • 两次重复操作:大核深度卷积(空间混合) → 1×1 点卷积(通道混合)。
    • 引入 内部残差连接(Inner Shortcut)缓解梯度消失。
  • 特征融合模块(Feature Fusion):
    • 3×3 深度卷积 + 门控机制(Gating Mechanism),增强局部特征交互。

关键公式(对应论文公式 1-3):

  1. 特征混合递归计算
    z k + 1 n = z 0 n + g ( z k n ) , g = { depthwise conv , k = 1 , 3 pointwise conv , k = 2 , 4 (Eq. 2) z_{k+1}^{n} = z_{0}^{n} + g(z_k^n), \quad g=\begin{cases} \text{depthwise conv}, & k=1,3 \\ \text{pointwise conv}, & k=2,4 \end{cases} \quad \text{(Eq. 2)} zk+1n=z0n+g(zkn),g={ depthwise conv,pointwise conv,k=1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

青铜锁00

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值