- 博客(30)
- 收藏
- 关注
原创 扩散模型学习
训练过程其实就是在训练 UNet 网络的参数。无论在前向过程还是反向过程,Unet 的职责都是根据当前的样本和时间 t 预测噪声。前向过程:从 1 到 T 的时间采样一个时间 t,生成一个随机噪声加到图片上,从 UNet 获取预测噪声,计算损失后更新 UNet 梯度。反向过程:先从正态分布随机采样和训练样本一样大小的纯噪声图片,从 T-1 到 0 逐步重复以下步骤:从。代码主要分为以下几块:Unet、GaussianDiffusion、Trainer。论文的源代码采用 UNet 实现对。
2025-04-10 10:45:58
122
原创 Multi-Stage Progressive Image Restoration论文阅读
图像复原任务在恢复图像时需要在空间细节与高层语境化信息之间取得复杂的平衡。本文提出了一种新颖的协同设计方法,能够最优地平衡这些竞争目标。我们的核心方案是一种多阶段架构,通过逐步学习退化输入的复原函数,将整体恢复过程分解为更易管理的步骤。具体而言,我们的模型首先利用编码器-解码器架构提取语境化特征,随后将其与保留局部信息的高分辨率分支相结合。在每个阶段,我们引入了一种基于原位监督注意力机制的逐像素自适应设计,用于重新加权局部特征。这种多阶段架构的关键在于不同阶段之间的信息交换。
2025-03-28 21:42:16
876
1
原创 Ingredient-oriented Multi-Degradation Learning for Image Restoration论文阅读
探索不同图像恢复任务之间的关联性对于揭示退化现象背后的内在机理具有重要意义。近年来,各类"多合一"方法蓬勃发展,能够在单一模型中处理多种图像退化问题。然而,在实际应用中,鲜有研究尝试通过挖掘各类退化现象的根本性成分来建立任务间的关联性,导致当涉及更多任务时,模型的可扩展性较差。本文提出一种新颖的成分导向范式,以替代传统的任务导向范式,从而实现可扩展的学习。具体而言,我们提出的方法名为成分导向退化重构框架(IDR),包含两个核心阶段:任务导向知识收集与成分导向知识整合。
2025-03-28 18:19:17
1208
1
原创 AutoDIR: Automatic All-in-One Image Restoration with Latent Diffusion 论文阅读 ECCV
本文提出了一种基于潜在扩散模型(LDM)的全自动一体化图像修复框架,旨在解决多种退化问题(如噪声、模糊、低分辨率、压缩伪影等)的联合修复挑战。现有方法通常针对单一或有限类型的退化进行优化,导致在复杂混合退化场景下表现受限。为此,我们设计了一个统一的生成模型,通过在扩散过程中引入可学习的退化嵌入(degradation embedding)机制,使模型能够自适应地感知并修复不同类型的图像退化。具体而言,我们通过以下创新点实现这一目标:(1) 提出多任务退化编码器,将退化特征与图像内容解耦(分开处理)
2025-03-28 13:27:37
1174
1
原创 Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring论文阅读
非均匀盲去模糊(Non-uniform blind deblurring)是计算机视觉中的一项挑战性问题,因为模糊不仅由多个物体的运动引起,还可能源于相机抖动和场景深度变化。为了消除这些复杂的运动模糊,传统基于能量优化的方法依赖于简单假设(例如模糊核局部均匀或线性)。此外,近期的基于机器学习的方法也依赖于在这些假设下生成的合成模糊数据集。这使得传统去模糊方法难以处理模糊核难以参数化的情况(例如物体运动边界)。本文提出了一种多尺度卷积神经网络(CNN),以端到端方式恢复清晰图像,适用于由多种因素导致的模糊。
2025-03-26 14:35:16
903
1
原创 LEDNet: Joint Low-light Enhancement and Deblurring in the Dark论文全面重点总结
研究问题的背景:光线不足 可见度颜色失真 最小快门速度有限 长时间曝光引起运动模糊 低光运动模糊同时存在存在问题:暗光增强后运动模糊过度曝光扩大 降噪平滑去除模糊信息 增强后去模糊实现没有效果 白天场景去模糊用不到晚上 低动态范围运动线索难被感知 晚上的模糊图像的饱和区域不符合白天的模糊模型。
2025-03-21 18:06:12
789
原创 LEDNet: Joint Low-light Enhancement and Deblurring in the Dark论文翻译
夜间摄影通常由于昏暗的环境和常见的长时间曝光而遭受低光和模糊问题。虽然现有的光增强和去模糊方法可以单独处理每个问题,但这些方法的级联不能和谐地应对可见性和清晰度的联合退化。训练一个端到端网络也是不可行的,因为没有配对数据可用于表征低光和模糊的共存。我们通过引入一个新的数据合成管道(数据合成过程或系统)来解决这个问题,该管道模拟现实的低光模糊退化,特别是对于饱和区域(图像中颜色或亮度达到最大值的区域)的模糊,例如经常出现在夜间图像中的光条纹。借助该管道,我们展示了第一个用于联合低光增强和去模糊的大规模数据集。
2025-03-21 17:59:22
124
原创 Deep Image Deblurring: A Survey 去模糊文献翻译原文
图像去模糊是低层计算机视觉中的经典问题,其目标是从模糊的输入图像中恢复出清晰图像。模糊可能由多种因素引起,例如失焦、相机抖动或目标快速运动。近年来,深度学习技术的进步显著推动了这一问题的解决,大量去模糊网络被提出。本文旨在对近期发表的基于深度学习的图像去模糊方法进行全面且及时的综述,以服务于学术界作为有价值的文献参考。我们首先讨论图像模糊的常见成因,介绍基准数据集和性能指标,并总结不同的问题建模方式。接着,我们提出一种基于卷积神经网络(CNN)的方法分类体系,从架构、损失函数和应用角度进行详细回顾与比较。
2025-03-14 15:11:23
341
原创 Deep Image Deblurring: A Survey 去模糊文献阅读
图像去模糊是低层计算机视觉中的经典问题,其目标是从模糊的输入图像中恢复出清晰图像。模糊可能由多种因素引起,例如失焦、相机抖动或目标快速运动。近年来,深度学习技术的进步显著推动了这一问题的解决,大量去模糊网络被提出。本文旨在对近期发表的基于深度学习的图像去模糊方法进行全面且及时的综述,以服务于学术界作为有价值的文献参考。我们首先讨论图像模糊的常见成因,介绍基准数据集和性能指标,并总结不同的问题建模方式。接着,我们提出一种基于卷积神经网络(CNN)的方法分类体系,从架构、损失函数和应用角度进行详细回顾与比较。
2025-03-14 14:54:38
952
原创 EnlightenGAN
我们提出了一种高效的无监督生成对抗网络,称为 EnlightenGAN,它可以在没有低/正常光照图像对的情况下进行训练,但在各种真实世界的测试图像上证明具有很好的泛化能力。然而,配对训练图像的可用性假设在处理更不受控制的场景(如去雾、去雨或低光增强)时带来了更多困难:1) 同时捕捉同一视觉场景的损坏和真实图像(例如,同时拍摄低光和正常光照图像对)非常困难,甚至不切实际;使用深度学习的最先进的图像恢复和增强方法严重依赖于合成或捕获的损坏和干净图像对进行训练,例如超分辨率[6]、去噪[7]和去模糊[8]。
2025-03-03 18:18:25
637
原创 Zero-Reference Deep Curve Estimation for Low-Light Image Enhancement 论文笔记
我们将在以下部分详细说明Zero-DCE中的关键组件,即LE-curve、DCE-Net和无参考损失函数。训练数据集:我们采用了来自SICE数据集Part1中的360个多曝光序列 [4] 来训练所提出的DCE-Net。为了在DCE-Net中实现零参考学习,我们提出了一组可微的无参考损失函数,使我们能够评估增强图像的质量。以下是用于训练我们的DCE-Net的四种类型的损失。我们展示了在没有参考图像的情况下,通过任务特定的无参考损失函数间接评估增强质量,训练深度图像增强模型的潜力。
2025-02-25 17:32:02
364
1
原创 暗光图像增强方法及代码大汇总——Benchmarking Low-Light Image Enhancement and Beyond论文综诉部分
基于Retinex的方法是最广泛采用的先验方法,自2017年以来,深度学习方法成为主流,这表明Retinex信号结构和从大规模数据中提取的数据驱动先验的有效性。统计模型基于的方法也是一个大的类别。然而,同一类中的不同方法也各不相同。它们的设计伴随着大量的专家领域知识,这使得它们不够灵活和通用,难以整合其他广泛使用的先验知识。深度学习方法结合了一些传统的先验知识,如Retinex结构和层特定的先验知识,以实现更好的增强性能。对抗学习被用来捕捉超出传统指标的视觉属性,以提供更美观的结果。
2025-02-18 17:20:44
1037
原创 暗光增强——Retinex理论学习
暗光增强学习链接Deep Retinex Decomposition for Low-Light Enhancement
2025-02-13 15:16:26
184
原创 图像增强——灰度变换和直方图均衡化
进行灰度拉伸:斜率大于1;比a小的设置成0,比b大的设置成255。比a小和比b大的都在做灰度压缩。这里直方图第三个是画错了的。纯黑对应0,纯白对应1。来自于刘晓玉老师的课。
2025-02-11 10:43:53
207
原创 《Learning Deep CNN Denoiser Prior for Image Restoration》论文学习
基于模型的优化方法和判别式学习方法一直是解决低级视觉中各种反问题的两种主要策略。基于模型的优化方法:这种方法对于处理不同的逆问题是灵活的,但为了达到良好的性能,通常需要复杂的先验信息,这会耗费大量时间。判别式学习方法:这种方法检测速度快,但其应用范围受限于特定任务。最近的研究表明,通过可变分裂技术,可以将降噪器优先插入作为基于模型的优化方法的一部分,以解决其他反问题(例如,去模糊)。当通过判别式学习获得降噪器时,这种整合带来了显著的优势。然而,与快速鉴别降噪器之前的整合研究仍然缺乏。
2025-01-11 22:28:43
660
原创 《Beyond a Gaussian Denoiser: Residual Learning of Deep CNN for Image Denoising》论文学习
本文研究了前馈去噪的卷积神经网络,与一般的在特定噪声水平下训练特定模型的现有方法不同,本文中的 DnCNN 模型能够处理具有未知噪声水平的高斯去噪(即盲高斯去噪)问题,利用残差学习和批归一化来加快训练过程并提高去噪性能。通过残差学习的策略,DnCNN隐式地去除了隐藏层中潜在的干净图像。作者根据这一特性,还训练单个的DnCNN模型来对几个一般的图像去噪任务进行处理,如高斯去噪单图像超分辨率和JPEG 图像去块,都表现出高效的性能。
2025-01-10 21:57:04
713
原创 数字图像处理(冈萨雷斯第三版)学习笔记 - Chapter 4 图像退化
大小要合适,如果太大在这个图会出现两个峰值,要把他们分离开来;如果太小就会无法估计噪声情况。
2025-01-06 18:56:48
144
原创 《Learning Deep CNN Denoiser Prior for Image Restoration》论文初步学习
基于模型的优化方法和判别式学习方法一直是解决低级视觉中各种反问题的两种主要策略。基于模型的优化方法:这种方法对于处理不同的逆问题是灵活的,但为了达到良好的性能,通常需要复杂的先验信息,这会耗费大量时间。判别式学习方法:这种方法检测速度快,但其应用范围受限于特定任务。最近的研究表明,通过可变分裂技术,可以将降噪器优先插入作为基于模型的优化方法的一部分,以解决其他反问题(例如,去模糊)。当通过判别式学习获得降噪器时,这种整合带来了显著的优势。然而,与快速鉴别降噪器之前的整合研究仍然缺乏。
2025-01-06 15:51:32
345
原创 《ASAM: Boosting Segment Anything Model with Adversarial Tuning》论文阅读
由 Meta AI 开发的 Segment Anything Model(SAM)在图像分割任务中表现杰出。然而,SAM 在某些特定的细分应用中也遇到了限制,这促使研究者寻找一种在不损害其固有泛化能力前提下对其进行性能提升的策略。当提到 Segment Anything Model (SAM) ,尽管 SAM 具备强大的图像分割能力,并且可以在没有特定领域训练的情况下应用于广泛的图像分割任务,但在一些特殊或专业领域的图像分割任务中,它的表现可能不如那些专门为此类任务定制和训练的模型。
2024-12-22 22:37:11
706
1
原创 《Practical Deep Raw Image Denoising on Mobile Devices》论文学习
论文翻译论文详细概述论文简要概述
2024-12-18 16:40:41
403
原创 两种经典的去噪算法NLM和BM3D
是像素的集合,也就是整幅图像。该算法的主要运算量还是在相似块的搜索与匹配上,在与NL-Means同样大小的相似块和搜索区域的情况下,BM3D的算法复杂度是要高于NL-Means的,应该大概在NL-Means的3倍左右。在求欧式距离的时候,不同位置的像素的权重是不一样的,距离块的中心越近,权重越大,距离中心越远,权重越小,权重服从高斯分布。一个有效的去除高斯噪声的方式是图像求平均,对N幅相同的图像求平均的结果将使得高斯噪声的方差降低到原来的N分之一,现在效果比较好的去噪算法都是基于这一思想来进行算法设计。
2024-12-13 20:31:20
640
原创 UNet、AttentionUNet网络学习
通俗易懂来讲就是:在原网络的基础上,在原特征图和上采样特征图进行拼接前,对下采样特征图和上采样特征图增加了一个Attention Gate网络结构的处理,处理完成之后,再进行拼接操作,其他结构是一样的。此度量范围为0到1,其中0表示无重叠,而1表示预测的和地面真实情况之间的完全重叠。(2)Dice coefficient:是预测值与之间之间的重叠的通用度量标准。(3)Intersection over Union:一个简单的度量标准,计算公式:预测的和真实值之间的重叠区域 / 并集的区域。
2024-12-11 19:30:56
342
原创 数字图像处理【杜克大学】(冈萨雷斯第三版)
杜克大学1-1杜克大学1-2杜克大学3-1杜克大学3-2杜克大学4一、绪论二、数字图像处理基础三、空间域图像增强四、频率域图像增强五、图像恢复六、彩色图像处理九、形态学处理十、图像分割总体有用的笔记
2024-10-21 14:19:23
186
原创 零基础开始学深度学习(从李宏毅老师课开始 持续更新)
仅仅用一层单纯的表示他们之间的关系并不能很好的表达更深层次的关系。那么深度学习进行的越深,那么能表示关系网越复杂,找到的联系越多,对于问题的解决就会有更好的效果!结构化学习(Structured learning):机器不只是要做选择题或输出一个数字,而是产生一个有结构的物体,比如让机器画一张图,写一篇文章,这种叫机器产生有结构的东西的问题称为结构化学习。回归(Regression):要找的函数的输出是一个数值,一个标量(scalar),这种机器学习的任务称为回归。机器学习就是让机器具备找一个函数的能力。
2024-09-11 21:25:26
208
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人