对比学习与图像去雾在24TIP和CVPR经典图像去雾论文中的良好结合,展示出模型良好的泛化能力(本期内容较详细 多)

今天主要内容是图像去雾,对比学习,无监督学习,要分享的三篇论文分别是:
21CVPR Contrastive Learning for Compact Single Image Dehazing
24 TIP UCL-Dehaze: Toward Real-World Image Dehazing via Unsupervised Contrastive Learning
24 CVPR ODCR: Orthogonal Decoupling Contrastive Regularization for Unpaired Image Dehazing
以及关于对比学习和模型泛化能力的碎碎念
下面开始正题

引言

相信很多做深度学习的同学对“对比学习”都不陌生,,今天的学习笔记·和·对比学习,图像去雾 都有联系,所以先回顾一下什么是对比学习:

对比学习的概念:

对比学习(Contrastive Learning)是一种自监督学习方法,通过比较数据样本之间的相似性和差异性来学习数据的良好特征或表征。其核心目标是通过对比相似和不相似样本,使模型学习到更加鲁棒的特征表示。

对比学习的基本思想源自表征学习中的相似性度量。在对比学习中,给定一个样本,模型需要判断哪些样本与它相似(正样本对),哪些样本与它不相似(负样本对)。这种相似性可以通过定义相似度函数(如余弦相似度)来衡量。模型的目标是最大化相似样本对之间的相似性,同时最小化不相似样本对之间的相似性。

对比学习包含几个关键组件:

数据增强:通过随机裁剪、翻转、颜色扰动等操作生成正样本对。
特征编码器:通常使用深度卷积神经网络(CNN)或预训练的Transformer模型提取样本的特征。
投影头:将特征编码器提取的高维特征通过小型全连接网络映射到较低维的空间。
相似度函数:常用的相似度度量包括欧几里得距离和余弦相似度,用于计算样本对之间的相似性。
对比损失函数:如InfoNCE损失,帮助模型学习区分正负样本对。

对比学习在许多领域都有广泛的应用

例如计算机视觉、自然语言处理和音频处理等。例如,在计算机视觉领域,对比学习被广泛应用于图像识别、目标检测和人脸识别等任务。在自然语言处理领域,对比学习被用于文本分类、情感分析、机器翻译等任务。此外,在音频处理领域,对比学习也被用于语音识别和音频分类等任务。

对比学习的成功在很大程度上取决于损失函数的设计。例如,InfoNCE损失函数就是基于互信息最大化的思想,通过优化正样本对的一致性并惩罚不匹配的负样本对来实现学习目标。此外,对比学习模型通常需要大量计算资源,但通过使用记忆库(Memory Bank)或动态量化等技术可以减少资源消耗

关于对比学习的概念我们先介绍到这,最近看了几篇与对比学习相关的顶刊和顶会图像去雾论文,都比较精彩,并且也都有一定的关联,今天总结一些亮点,一起学习一下:

在开始引入一下24年的两篇论文之前,我们先来看一篇关于对比正则化图像去雾比较经典的21年CVPR论文

题目:Contrastive Learning for Compact Single Image Dehazing
链接:https://openaccess.thecvf.com/content/CVPR2021/papers/Wu_Contrastive_Learning_for_Compact_Single_Image_Dehazing_CVPR_2021_paper.pdf
代码链接:https://github.com/GlassyWu/AECR-Net.

这一篇论文是我刚接触对比正则化的时候看的一篇论文,很亮眼,先来看他的摘要:

摘要:

Single image dehazing is a challenging ill-posed problem due to the severe information degeneration. However,
existing deep learning based dehazing methods only adopt clear images as positive samples to guide the training of dehazing network while negative information is unexploited.Moreover, most of them focus on strengthening the dehazing network with an increase of depth and width, leading to a significant requirement of computation and memory. In this paper, we propose a novel contrastive regularization (CR) built upon contrastive learning to exploit both the information of hazy images and clear images as negative and positive samples, respectively. CR ensures that the restored image is pulled to closer to the clear image and pushed to far away from the hazy image in the representation space. Furthermore, considering trade-off between performance and memory storage, we develop a compact dehazing network based on autoencoder-like (AE) framework. It involves an adaptive mixup operation and a dynamic feature enhancement module, wh

提供的引用内容未涉及CVPR会议中基础的医学图像分割论文的精读内容,无法直接根据引用回答该问题。不过一般对CVPR会议中基础医学图像分割论文进行精读可以从以下方面入手: ### 论文背景动机 了解论文提出的背景,即当前医学图像分割领域存在的问题挑战。例如,传统分割方法在处理复杂医学图像(如存在噪声、组织重叠等情况)时的局限性。明确论文作者试图解决的具体问题,以及该问题对医学诊断、治疗等方面的重要性。 ### 相关工作综述 梳理论文中提及的相关研究工作,分析已有方法的优缺点。这有助于理解该论文在整个研究领域中的位置,以及它是如何在前人工作的基础上进行改进创新的。 ### 方法详细解读 深入剖析论文所提出的医学图像分割方法。这可能包括模型的架构设计,如使用的卷积神经网络(CNN)结构、不同层的作用功能;算法的具体步骤,如数据预处理、特征提取、分割决策等过程;以及可能使用的特殊技术或策略,如注意力机制、尺度特征融合等。 ### 实验设计结果分析 研究论文的实验设计,包括使用的数据集(如公开的医学图像数据集)、实验设置(如训练测试的划分比例)、评估指标(如Dice系数、交并比等)。仔细分析实验结果,对比论文方法其他现有方法的性能差异,判断该方法的有效性优越性。同时,关注实验结果中的误差分析,了解方法在哪些情况下可能表现不佳,以及作者提出的改进方向。 ### 创新点贡献总结 总结论文的创新点,即现有方法相比,该论文独特的地方。这些创新点可能体现在模型结构、算法流程、数据处理等方面。评估论文对医学图像分割领域的贡献,以及它可能带来的实际应用价值,如提高医学诊断的准确性、辅助手术规划等。 以代码示例来说,若论文中提出了一种基于CNN的医学图像分割模型,可能会有如下简单的Python代码示例(使用PyTorch框架): ```python import torch import torch.nn as nn class SimpleMedicalSegmentationModel(nn.Module): def __init__(self): super(SimpleMedicalSegmentationModel, self).__init__() self.conv1 = nn.Conv2d(1, 16, kernel_size=3, padding=1) self.relu1 = nn.ReLU() self.conv2 = nn.Conv2d(16, 32, kernel_size=3, padding=1) self.relu2 = nn.ReLU() self.conv3 = nn.Conv2d(32, 1, kernel_size=1) self.sigmoid = nn.Sigmoid() def forward(self, x): x = self.relu1(self.conv1(x)) x = self.relu2(self.conv2(x)) x = self.sigmoid(self.conv3(x)) return x # 创建模型实例 model = SimpleMedicalSegmentationModel() ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值