自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

fovever_的博客

原创【图像融合前沿】图像融合领域高影响力论文全景报告 (引用＞ 500)

本文基于Google Scholar数据，深度盘点2018-2024年图像融合领域27篇引用超500次的巅峰论文。涵盖马佳义、李树涛等领军团队主页、全量论文索引及代码链接，剖析技术演进趋势，助你一文掌握科研前沿。

2025-12-23 18:30:20 620

原创图像融合入门论文精选（2019–2025）

本文整理了2019-2025年图像融合领域的代表性深度学习方法，重点聚焦红外-可见光融合(IVIF)、多模态融合和通用图像融合三大场景。文章从分类(视觉/语义/配准/鲁棒)、基础框架(CNN/Transformer/Diffusion等)、监督范式(有/无监督)和发表去向四个维度对方法进行系统归类。特别关注了语义驱动融合、退化鲁棒融合等新兴方向，收录了ControlFusion、CDTFusion、DCEvo等最新工作，并提供了论文和代码链接。该整理可作为入门阅读指南和方法对比索引，建议结合其他综述资源共同

2025-12-01 18:46:25 693 1

原创 ACM MM 24 | DRMF: Degradation-Robust Multi-Modal Image Fusion via Composable Diffusion Prior

摘要本文提出了一种基于可组合扩散先验的鲁棒多模态图像融合方法(DRMF)，旨在解决现有方法在复杂退化条件下(如低光、噪声、低分辨率)性能受限的问题。该方法通过预训练多个针对不同模态的鲁棒条件扩散模型，利用扩散模型强大的生成能力处理各种图像退化。核心创新在于设计了扩散先验组合模块，能够整合来自不同模态的生成先验，实现有效的多模态信息融合。实验表明，DRMF在红外-可见光和医学图像融合任务中表现优异，尤其在复杂退化条件下显著优于现有方法。代码已开源。

2025-10-15 11:28:21 559

原创 IEEE TPAMI 25| Mask-DiFuser: A Masked Diffusion Model for Unified Unsupervised Image Fusion

本文提出了一种基于掩模扩散模型的无监督图像融合方法Mask-DiFuser，通过将融合任务转化为双重掩模图像重建任务，有效解决了传统方法因缺乏真实标注数据带来的挑战。该方法设计了创新的双重掩模方案模拟互补信息，结合扩散模型和注意力机制进行特征提取与融合，在红外-可见光、医学、多曝光和多聚焦等多种融合任务上表现优异。实验表明，Mask-DiFuser能生成更符合人类视觉感知的高质量融合图像，显著优于现有最佳方法。该工作为无监督图像融合提供了新思路，具有重要的理论意义和应用价值。

2025-10-14 23:01:57 1120

原创 NeurIPS25 | ControlFusion:A Controllable Image Fusion Network with Language-Vision Degradation Promp

ControlFusion：基于语言-视觉退化提示的可控图像融合网络针对现有图像融合方法在处理真实场景复合退化时缺乏灵活性的问题，本文提出ControlFusion框架。通过物理驱动的退化成像模型（结合Retinex理论和大气散射原理）模拟红外-可见光双模态的复合退化，为训练提供真实数据支持。网络核心包含提示调制的恢复融合模块，能根据用户文本指令或视觉适配器提取的退化提示动态调整特征，实现自适应增强。空间-频率协同视觉适配器通过频域先验自主感知输入图像的退化程度，减少人工干预。

2025-10-14 21:38:18 634

原创 IJCV 25 | C2RF: 基于共性挖掘与对比学习的多模图像配准与融合

本文提出C2RF框架，通过共性挖掘和对比学习解决多模态图像配准与融合的关键问题。现有融合方法在源图像错位时会产生伪影，而传统三步式方案完全依赖配准结果。C2RF创新地将多模态图像分解为共享特征和私有特征，缓解配准与融合的矛盾。同时引入基于融合的对比学习机制，利用对齐与错位样本作为正负样本指导配准优化，并设计困难负样本挖掘策略增强对微小伪影的鲁棒性。实验表明，C2RF在可见光-红外和医学图像融合任务中均优于现有方法，尤其在错位场景下表现突出。该框架为多模态图像处理提供了新思路，相关代码已开源。

2025-08-19 22:34:33 535 2

原创 ICCV 25 | CoMatch: Covisibility-Aware Transformer for Subpixel Matching

图像匹配方向最新论文CoMatch是一种基于动态共视感知 Transformer 的半稠密图像匹配网络，显著提升纹理稀疏和大视角变化场景的匹配性能。核心创新包括：1）动态共视感知 Transformer（DCAT），通过共视引导的 Token 凝聚和注意力机制优化特征交互；2）双边子像素精化（BSR），双向提升匹配几何一致性。

2025-07-09 21:49:31 633

原创 JCR 2024 影响因子

JCR 2024 于2025年6月18日正式发布。本博客整理了计算机视觉相关学科的部分期刊的影响因子。

2025-06-18 20:03:21 530

原创计算机视觉与人工智能领域常用期刊和会议缩写

在撰写论文时有时候会面临超篇幅的情况，这时候一个常用的操作便是使用期刊（会议）的缩写或者半缩写来替换期刊（会议）全称。为了方便自己后续使用相关的缩写特此整理

2024-06-27 12:10:41 3590

原创计算机视觉-机器学习-人工智能顶会会议召开地址

最近应该要整理中文资料的参考文献，很多会议文献都需要补全会议地点（新国标要求）。四处百度感觉也挺麻烦的，而且没有比较齐全的网站可以搜索。因此自己整理了一下领域相关的顶会，主要整理的是自以来每一届顶会的会议地点，便于以后整理文献的时候查找。

2023-12-11 10:20:05 3096

原创 PIL image.resize() 报错AttributeError: module ‘PIL.Image‘ has no attribute ‘ANTIALIAS‘ 解决方案

使用PIL读取图像后对其进行Resize时由于PIL 版本问题出现`AttributeError: module 'PIL.Image' has no attribute 'ANTIALIAS'`，简要介绍相关的Debug过程

2023-11-29 15:24:09 10798 2

原创科研工具推荐之ReadPaper

科研工具推荐之ReadPaper.之前也用很多朋友在问英文文献如何阅读，一直推荐的是Adobe PDF+有道翻译。最近了解到了另外一个神器 ReadPaper 自己稍微体验了一下感觉非常nice，特此推荐给大家。

2023-11-27 11:10:30 1907

原创下载huggingface预训练模型到本地并调用

在大模型横行的时代，无法在服务器上连接外网的研究僧真的是太苦逼了，每次想尝试类似于CLIP，BLIP之类的大模型面临无法从外网下载预训练权重的问题，本篇博客详细介绍了在本地下载预训练模型文件，并在服务器上调用的过程。

2023-11-15 16:37:25 22477 15

原创 Diffusion程序调试相关问题汇总

作为一个强大的生成模型，Diffusion Model（扩散模型）已经“侵袭”了各类low-level视觉任务。现有的Diffusion Model都是基于Stable diffusion实现的，在复现的时候会遇到一些问题，本篇博文总结了自己在复现过程中遇到的一些bug，及其解决方案。希望能有帮助。

2023-07-26 09:53:46 4539 4

原创 Linux系统(Ubuntu)查看某个进程(PID)所属的目录

在维护服务器的过程中，有时候会出现一些进程没人认领，这个时候会影响资源的合理分配，也担心系统被人入侵。使用nvidia-smi 以及htop，top也只能知道是哪个进程（PID）占用的资源，但是并不能知道是谁的程序。此时可以通过ll /proc/PID 指令来查看进程所属的目录从而就可以知道是谁的程序了。

2023-04-05 12:22:58 2849

原创 Anaconda 创建，复制，删除环境（通过yml文件移植到其他服务器上）

在服务器上配置环境时，有时候就想偷个懒，把其他服务器上现成的环境复制过来用，这里记录一下自己新建环境，复制环境，以及通过yml从其他服务器上移植环境，以及最后删除虚拟环境的一些操作或指令。

2023-03-20 15:48:30 2483 2

原创 Ubuntu 设置 SSH 通过密钥登录

我们一般使用 VSCode 、MobaXterm、PuTTY等 SSH 客户端来远程管理 Linux 服务器。但是，一般的密码方式登录，容易有密码被暴力破解的问题。所以，一般我们会将 SSH 的端口设置为默认的 22 以外的端口，或者禁用 root 账户登录。但是即使是将端口设置为22之外的端口也容易泄露。为了保证服务器安全，此时希望使用密钥方式登录。而且使用秘钥登录能够避免每次登录时反复输入账户密码。

2023-03-18 21:48:43 7019 1

原创 Ubuntu系统新硬盘挂载

服务器通常会面临存在不足的问题，大部分服务器都是ubuntu系统，该篇博客浅浅记载一下在ubuntu系统上挂载新硬盘的步骤。本篇博文仅仅记载简单挂载一块新的硬盘，而没有对硬盘进行分区啥的。

2023-03-05 16:56:37 1107

原创图像融合评估指标Python版

这篇博客利用Python把大部分图像融合指标基[图像融合评估指标复现了，从而方便大家更好的使用Python进行指标计算，以及一些I/O 操作。除了几个特征互信息的指标没有成功复现之外，其他指标均可以通过这篇博客提到的Python程序计算得到.

2023-03-04 11:58:17 9036 36

原创 VIF-Benchmark: All infrare and visible image fusion method in one framework

所有主流的基于深度学习的红外和可见光图像融合方法都被集成在了这个框架中。方便大家实验比较。

2023-02-28 21:02:54 2401 17

原创图像highlight显示matlab程序

提供框选部分区域highligh部分区域，以及放大部分区域显示的MATLAB程序。

2023-02-23 12:23:23 1210 6

原创从零开始使用MMSegmentation训练Segformer

写在前面：最新想要用最新的分割算法如：Segformer or SegNeXt 在自己的数据集上进行训练，但是有不是搞语义分割出身的，而且也没有系统的学过MMCV以及MMSegmentation。所以就折腾了很久，感觉利用MMSegmentation搭建框架可能比较系统，但是对于不熟悉的或者初学者非常不友好，因此记录一下自己training Segformer的心路历程。

2023-02-20 15:59:34 5513 39

原创 Pytorch 多卡并行训练教程（DDP）

Pytorch 多卡并行训练教程（DDP），关于使用DDP进行多开并行训练网上有许多教程，而且很多对原理解析的也比较透彻，但是有时候看起来还是比较懵逼，再啃了许多相关的博客后，博主记录了一些自己对于使用torch.nn.DistributedDataParallel(DDP)进行单机多卡并行训练的一些体会，希望能对入门的小白有一定的帮助，不足之处也希望指出，大家一起交流学习。

2023-01-01 21:54:44 6716 7

原创 Latex排列图片--高效科研工具

之前介绍高效科研工具的时候，有说过在论文中排列图片是的几种方案，其中一种就是用latex排图，可以很好地插入到Latex写作的论文中。

2022-12-19 15:17:20 1382

原创计算机视觉三大顶会论文入口列表

计算机视觉三大顶会论文入口列表

2022-12-16 21:24:16 1215

原创高效科研工具集合

工欲善其事，必先利其器，掌握一些高效的生产力科研工具，可以在我们科研途中起到事半功倍的作用，下面主要介绍一些个人用来提升效率的科研工具套件。

2022-12-03 11:09:42 1730 3

原创 Spatial Transformer Networks

对于计算机视觉任务来说,我们希望模型可以对于物体姿势或位置的变化具有一定的不变性,从而在不同场景下实现对于物体的分析。传统CNN中使用卷积和Pooling操作在一定程度上实现了平移不变性,但这种人工设定的变换规则使得网络过分的依赖先验知识,既不能真正实现平移不变性(不变性对于平移的要求很高),又使得CNN对于旋转,扭曲等未人为设定的几何变换缺乏应有的特征不变性。为此作者提出了Spatial Transformer Networks。

2022-12-01 16:12:11 860

原创科研绘图配色方案

在撰写论文的时候，美观，大气，上档次的图表能够很好地给自己的论文加分。但是在绘制图表的时候往往会面临色彩搭配的问题，选择合适的色彩搭配能够有效地展示自己的方法，但是色彩搭配选择不当的话往往会被人质疑审美也会给论文造成负面影响。这篇博文结合了网上的一些配色方案，并进行了相关总结。希望为自己后续绘图提供色彩搭配的参考，也希望能够帮助到大家。

2022-12-01 16:02:57 29618

原创使用TinyPNG API压缩图片

在撰写论文的时候，美观，大气，上档次的图标能够很好地给自己的论文加分，好的可视化结果也能够让审稿人赏心悦目。但是有时候在可视化图片的时候有可能原始图像过大从而很占内存；这时候就希望能够是有一个无损压缩工具来压缩图像。目前笔者尝试过感觉能够达到较好的压缩效果而且基本上不影响视觉效果。而且也有对应的安装包, TinyGUI 是网友根据TinyPNG提供的应用程序接口开发的本地桌面端工具。b本篇博客主要提供一份Python来遍历文件夹下的所有图片以压缩图片。

2022-11-19 22:41:54 2845

原创 DIVFusion:首个耦合互促低光增强&图像融合的框架

最近Information Fusion接收了一篇题为《DIVFusion: Darkness-free infrared and visible image fusion》的文章。在此之前，图像融合领域一直徘徊在利用互补信息，设计loss，引入新的融合规则等。但是忽视了低光场景下可见光信息退化的问题，这将严重影响互补信息的聚合，也即产生不佳的融合结果。DIVFusion一文中给出了一个很新的思想来解决低光下的融合问题，即是耦合互促低光增强与融合，以获得良好视觉感知的融合图像。

2022-11-15 23:01:17 8175 41

原创一些方便自己批量处理文件的Python函数

一些方便自己处理文件的Python函数用python批量处理文件（复制、重命名比较方便）但是很多函数的用法就是记不住，因此在这里记录一些以后免得四处去百度

2022-10-27 20:57:48 539

原创帮推|基于深度学习的图像融合方法综述

博主朋友关于图像融合的综述论文[基于深度学习的图像融合方法综述](http://www.cjig.cn/jig/ch/reader/view_abstract.aspx?edit_id=20220728162841001&flag=2&file_no=202204300000002&journal_id=jig)已被《中国图象图形学报》正式接收！极力推荐想要入门图像融合领域的小伙伴下载学习，此外希望在图像融合领域深耕的朋友又可以从论文中总结的**挑战和展望**获取一些新的思路。...

2022-08-31 12:11:11 6333 12

原创图像融合--挑战、机遇与对策

作为一项重要的图像增强技术，图像融合在诸如目标检测、语义分割、临床诊断、遥感监测、视频监控和军事侦察等任务中发挥着至关重要的作用。近年来，随着深度学习技术的不断进步，基于深度学习的图像融合算法也如雨后春笋般涌现。尽管深度学习已经在图像融合领域取得了巨大的成功，但是仍存在一些严峻的挑战和难题需要被攻克。.........

2022-07-04 19:33:07 3783 10

原创图像融合论文及代码整理最全大合集

本博文全面整理了图像融合领域的论文及代码。主要包括红外和可见光图像融合，医学图像融合，多聚焦图像融合，多曝光图像融合以及全色图像锐化等众多融合场景。同时提供了每个融合场景中常用数据集的下载地址并整理了常用评估指标。有助于新人系统地了解图像融合领域的脉络及发展。............

2022-05-08 16:57:44 54091 65

原创彩色图像融合

本博客主要介绍如何处理图像融合问题中的色彩信息。大部分算法都可以将彩色图像从RGB空间转换至YCbCr空间，由于图像的结构细节以及强度信息主要集中在Y通道中，因此通常将Y通道作为融合算法的输入并生成融合的Y通道。对于只有一幅图像包含色彩信息的融合场景像红外和可见光图像融合，医学图像融合，以及近红外和可见光图像融合，只需要将融合的Y通道与彩色图像的Cb和Cr通道转换会RGB空间即可。对于两幅图像都具有色彩信息则根据下式进行融合：

2022-05-07 11:14:07 4682 13

原创基于深度学习的医学图像融合(Medical image fusion)论文及代码整理

基于深度学习的医学图像融合(Medical image fusion)论文及代码整理。主要将已有的基于深度学习的医学图像融合算法归类为基于卷积神经网络的医学图像融合框架和基于生成对抗网络的医学图像融合框架。

2022-05-01 10:57:14 10532

原创基于深度学习的全色图像锐化(Pansharpening)论文及代码整理

基于深度学习的全色图像锐化(Pansharpening)论文及代码整理。主要从有监督的全色图像锐化框架和无监督的全色图像锐化框架两个方面来整理现有的基于深度学习的全色图像锐化论文。

2022-04-30 22:57:56 12174 1

原创基于深度学习的多聚焦图像融合(Multi-Focus Image Fusion)论文及代码整理

基于深度学习的多聚焦图像融合(Multi-Focus Image Fusion)论文及代码整理。主要介绍了基于卷积神经网络的多聚焦图像框架和基于生成对抗网络的图像融合框架。

2022-04-30 20:13:39 10038 14

原创基于深度学习的多曝光图像融合(Multi-exposure Image Fusion)论文及代码整理

基于深度学习的多曝光图像融合论文及代码整理

2022-04-28 16:46:26 5999

原创图像融合常用数据集整理

图像融合常用数据集整理

2022-04-25 17:53:21 25855 31

最全图像融合评估指标.zip

该压缩包用于评估融合图像的各项指标对应于博客《图像融合评估指标》以及《红外和可见光图像融合文章整理》，具体细节可以参考以上博客，建议初次接触的朋友调试main_easy.m文件，想要批量测试不同融合算法的话可以调试mian.m文件。

2021-08-31

图像融合-评估指标-python

使用Python实现了大部分图像融合评估指标，包括信息熵(EN),空间频率(SF),标准差(SD),峰值信噪比(PSNR),均方误差(MSE),互信息(MI),视觉保真度(VIF),平均梯度(AG),相关系数(CC),差异相关和(SCD),基于梯度的融合性能(Qabf),结构相似度测量(SSIM),多尺度结构相似度测量(MS-SSIM),基于噪声评估的融合性能(Nabf)。支持评估单幅图像，单个算法的所有融合结果，以及所有直接计算所有对比算法的结果，同时支持写入excel。

2023-03-09

VIF-Benchmark

我们把所有主流的基于深度学习的红外和可见光图像融合方法都集成在了这个框架中。

2023-02-28

图像highlight显示matlab程序

图像highlight显示matlab程序

2023-02-23

Latex图片排列-高效科研工具

之前介绍高效科研工具的时候，有说过在论文中排列图片是的几种方案，其中一种就是用latex排图，可以很好地插入到Latex写作的论文中，这个文件提供了相应的latex代码和图片文件夹，方便大家演示和尝试。

2022-12-19

PDF转图片的程序Demo-PDF2Img

用来将PDF格式的图片无损转换为JPG 或者Png等图片格式

2022-12-02

PDF-Cut-White

高效科研工具中的一个基于Python实现用于自动裁剪PDF文件中的白边（主要针对latex凭拼接的图像）使用于广大的科研朋友。

2022-12-02

色彩图像融合-RGB2YCbCr

用于处理图像融合过程中的色彩信息。大部分算法都可以将彩色图像从RGB空间转换至YCbCr空间，由于图像的结构细节以及强度信息主要集中在Y通道中，因此通常将Y通道作为融合算法的输入并生成融合的Y通道。对于只有一幅图像包含色彩信息的融合场景像红外和可见光图像融合，医学图像融合，以及近红外和可见光图像融合，只需要将融合的Y通道与彩色图像的Cb和Cr通道转换会RGB空间即可。对于两幅图像都具有色彩信息则根据下式进行融合。

2022-05-07

航拍瓷瓶数据集--yoloV3训练数据集.zip

该资源为博客 https://blog.youkuaiyun.com/fovever_/article/details/102815346 中使用的部分数据集，为了方便大家学习如何制作自己的数据集并训练模型，特此上传！

2020-05-29

Evaluation.zip

该程序主要是用于评估红外和可见光图像融合性能的指标，通过整合开源的评估代码能够将所有的指标通过main函数得到。

2020-06-22

AlterID-Tools.zip

当使用teamviewer是可能会遇到，限制时长的问题！此时需要使用可以使用该工具修改一下当前电脑的teamviewer的ID即可！

2020-06-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除