PyTorch 深度学习实战（28）：对比学习（Contrastive Learning）与自监督表示学习

最新推荐文章于 2025-05-06 17:32:05 发布

原创

最新推荐文章于 2025-05-06 17:32:05 发布

· 1.7k 阅读

8 ·

版权

文章标签：

#深度学习 #人工智能

在上一篇文章中，我们探讨了扩散模型（Diffusion Models）在图像生成中的应用。本文将重点介绍对比学习（Contrastive Learning），这是一种通过构建正负样本对来学习数据表征的自监督学习方法。我们将使用 PyTorch 实现一个简单的对比学习模型，并在 CIFAR-10 数据集上进行验证。

一、对比学习基础

对比学习的核心思想是通过最大化相似样本对的相似性，同时最小化不相似样本对的相似性。这种方法无需人工标注数据，即可学习到具有判别性的特征表示。

1. 对比学习的核心组件

数据增强：
- 通过随机裁剪、颜色变换等操作生成同一图像的不同视图，构建正样本对。
编码器网络：
- 将输入数据映射到低维特征空间（如 ResNet）。
投影头：
- 将特征映射到对比学习空间（通常使用 MLP）。
对比损失函数：
- 常用的 InfoNCE 损失函数，通过温度参数控制样本对的区分度。

2. 对比学习的数学原理

InfoNCE 损失函数定义为：

3. 对比学习的优势

无需标注数据：
- 通过自监督方式学习通用特征表示。
特征可迁移性强：
- 预训练的特征可用于下游分类、检测等任务。
鲁棒性高：
- 对数据增强和噪声具有较好的适应性。

二、CIFAR-10 实战

我们使用 PyTorch 实现对比学习模型，并在 CIFAR-10 数据集上预训练特征编码器，最后通过线性评估验证特征质量。

1. 实现步骤

定义数据增强策略
构建编码器（ResNet-18）和投影头（MLP）
实现 InfoNCE 损失函数
预训练特征编码器
冻结编码器，训练线性分类器评估特征

2. 代码实现

import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms
from tqdm import tqdm
import numpy as np

# 设备配置
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# 修正的数据增强策略
class ContrastiveTransformat

最低0.47元/天解锁文章