图像融合论文阅读:SDNet: A Versatile Squeeze-and-Decomposition Network for Real-Time Image Fusion

@article{zhang2021sdnet,
title={SDNet: A versatile squeeze-and-decomposition network for real-time image fusion},
author={Zhang, Hao and Ma, Jiayi},
journal={International Journal of Computer Vision},
volume={129},
pages={2761–2785},
year={2021},
publisher={Springer}
}

论文级别:SCI A2/Q1
影响因子:19.5

📖[论文下载地址]

💽[代码下载地址]

📖论文解读

这篇论文的作者团队其他的论文FusionGAN、DDcGAN、DeFusion、U2Fusion、SeAFusion、SwinFusion……
[Jiayi Ma (马佳义)教授-谷歌学术]
[(马佳义)]
好厉害,膜拜大佬

🔑关键词

Image fusion 图像融合
Real time 实时
Adaptive 自适应
Proportion 比例
Squeeze decomposition 压缩分解

💭核心思想

💭思想核心

  • 图像融合任务可以认为是梯度和强度的提取和重建
  • 损失函数= 梯度项(加入了自适应决策块)+强度项(权重设置策略)
  • 将压缩分解思想引入图像融合,即通过分解过程来优化压缩过程
    • 源图像->融合图像(压缩过程)
    • 融合图像->源图像(分解过程)
  • SDNet与自编码器网络结构很相似

💭详细核心

作者提出了【压缩分解网络(squeeze-and-decomposition network ,SDNet)】来【实时】处理【多模态图像融合(VIF,PET-MRI)】和【数字图像融合(多聚焦、多曝光)】。图像融合问题可以理解为【梯度】和【强度】信息被【提取】和【重建】的过程。同时作者还设计了由梯度项和强度项组成的损失函数。

  • 在梯度项中,引入了【自适应决策块】
    • 【自适应决策块】可以根据【像素尺度】上的【纹理丰富程度】,来确定【梯度分布】的【优化目标】,这样可以在融合结果中保留更多的纹理细节
  • 在强度项中,通过【调整】每个【强度损失项】的【权重】。因此可以完成多种图像融合任务。

此外,作者将【压缩分解】引入图像融合中,不仅考虑了源图像到融合图像的压缩过程,还考虑了融合图像到源图像的分解过程。这样做是因为图像分解的质量直接与融合图像挂钩,也因此可以从分解的反方向来约束融合,从而生成更好的融合效果。

💭思想扩展

该论文的先前版本:
[Rethinking the Image Fusion: A Fast Unified Image Fusion Network based on Proportional Maintenance of Gradient and Intensity]
下图为本论文先前版本PMGI的网络结构图。
论文先前版本结构图

参考链接
[什么是图像融合?(一看就通,通俗易懂)]

🪢网络结构

作者提出的网路结构如下图所示。
在这里插入图片描述
在这里插入图片描述

📉损失函数

损失函数由【压缩函数损失 L s f \mathcal L_{sf} Lsf】【分解连贯损失 L d c \mathcal L_{dc} Ldc】两部分组成:
在这里插入图片描述

📉压缩函数损失

压缩函数损失决定了提取信息的类型以及重建过程中各类信息的主次关系。由【梯度损失 L g r a d \mathcal L_{grad} Lgrad】【强度损失 L i n t \mathcal L_{int} Lint】组成:
在这里插入图片描述
β \beta β是平衡系数,设置为10,80,50和3

📉梯度损失

梯度损失 L g r a d \mathcal L_{grad} Lgrad想让融合图像拥有更丰富的纹理细节。作者在梯度损失里加入了【自适应决策块】来指导融合图像纹理与源图像对应位置的最强纹理保持一致:
在这里插入图片描述
i和j代表决策图或梯度图第i行第j列的像素,H和W为图像的高和宽, I 1 I_1 I1 I 2 I_2 I2为源图像, I f u s e I_{fuse} Ifuse为融合图像。∇(·)代表使用拉普拉斯算子计算梯度图。S(·)为决策块基于源图像梯度计算的决策图。
决策块原理图如图3所示。
在这里插入图片描述
为了降低噪声对梯度的影响,首先将源图像进行高斯低通滤波,然后使用拉姆拉斯算子计算梯度图,并根据梯度大小在像素尺度上生成决策图。决策图生成过程可公式化为:
在这里插入图片描述
|·|是绝对值操作。∇(·)是拉普拉斯操作。L(·)是高斯低通滤波。min(·)最小。sign(·)符号函数。
注意:决策图的大小也是H×W。

📉强度损失

强度损失 L i n t \mathcal L_{int} Lint用于指导融合图像保留像素强度信息,同时还可以是融合图像整体风格更真实自然。强度损失公式为:
在这里插入图片描述
α \alpha α的比例设置策略与图像融合类型有关:本文设置为0.5或1

  • 多模态图像融合
    融合图像的强度分布往往偏向于某一特定的源图像,如VIF中偏向红外图像,PET-MRI偏向PET。因此:
    在这里插入图片描述
  • 数字图像融合
    该类型图像彼此具有很强的互补性,没有高低贵贱。因此:
    在这里插入图片描述

📉分解连贯损失

在这里插入图片描述
I 1 _ d e I_{1\_de} I1_de I 2 _ d e I_{2\_de} I2_de分别代表融合图像的分解结果1和2。 I 1 I_1 I1 I 2 I_2 I2是源图像。

🔢数据集

  • PET-MRI:Harvard,裁剪为120×120
  • VIF :TNO,裁剪为120×120
  • MEIF:来自 Learning a deep single image contrast enhancer from multi-exposure images,裁剪为120×120
  • MFIF:来自Multi-focus image fusion using dictionary-based sparse representation,裁剪为60×60

图像融合数据集链接
[图像融合常用数据集整理]

🎢训练设置

如果源图像是彩色RGB,则将其转换为YCbCr,使用源图像Y通道融合。并根据下式对源图像的CbCr进行融合:
在这里插入图片描述
C是融合后的Cb或者Cr, C 1 C_1 C1 C 2 C_2 C2分别代表两个源图像的Cb或者Cr。ζ是动态范围中值设置为128.

在测试阶段,只使用了压缩网络,没有使用分解网络。

🔬实验

📏评价指标

  • EN
  • F M I d c t FMI_{dct} FMIdct
  • PSNR
  • MG

参考资料
[图像融合定量指标分析]

🥅Baseline

  • ASR, PCA, NSCT, CNN, GTF, MDLatLRR, DenseFuse, FusionGAN, U2Fusion

参考资料
[图像融合论文baseline及其网络模型]

🔬实验结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

更多实验结果及分析,可在原文中查看:
📖[论文下载地址]

💽[代码下载地址]


🚀传送门

📑图像融合相关论文阅读笔记

📑[SDNet: A Versatile Squeeze-and-Decomposition Network for Real-Time Image Fusion]
📑[DDcGAN: A Dual-Discriminator Conditional Generative Adversarial Network for Multi-Resolution Image Fusion]
📑[FusionGAN: A generative adversarial network for infrared and visible image fusion]
📑[PIAFusion: A progressive infrared and visible image fusion network based on illumination aw]
📑[Visible and Infrared Image Fusion Using Deep Learning]
📑[CDDFuse: Correlation-Driven Dual-Branch Feature Decomposition for Multi-Modality Image Fusion]
📑[U2Fusion: A Unified Unsupervised Image Fusion Network]

📚图像融合论文baseline总结

📚[图像融合论文baseline及其网络模型]

📑其他论文

[3D目标检测综述:Multi-Modal 3D Object Detection in Autonomous Driving:A Survey]

🎈其他总结

🎈[CVPR2023、ICCV2023论文题目汇总及词频统计]

✨精品文章总结

[图像融合论文及代码整理最全大合集]
[图像融合常用数据集整理]

如有疑问可联系:420269520@qq.com;
码字不易,【关注,收藏,点赞】一键三连是我持续更新的动力,祝各位早发paper,顺利毕业~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

图像强

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值