pytorch框架学习（18）——finetune

最新推荐文章于 2024-08-06 20:28:49 发布

原创最新推荐文章于 2024-08-06 20:28:49 发布 · 346 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #pytorch

Pytorch 专栏收录该内容

26 篇文章

订阅专栏

本文探讨了迁移学习的基本概念，将其分为特征提取和分类器两部分，并详细介绍了在PyTorch中实施模型微调的具体步骤，包括加载预训练模型、修改输出层及设置不同的学习率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

1. Transfer Learning & Model Finetune
2. Pytorch中的Finetune

1. Transfer Learning & Model Finetune

Transfer Learning：机器学习分支，研究源域（source domain）的知识如何应用到目标域（target domain）
Model Finetune：模型的迁移学习

我们一般可以将一个卷积神经网络分为两部分，一般将前面的一些列卷积池化操作定义为features extractor，通过这些卷积池化操作得到feature map，我们就认为这些feature maps就是他的特征，这些feature maps 最后会与一些列的全连接层（FC层），而这些全连接层可以看做classifier部分，因此将一个卷积神经网络分为特征提取部分和分类器部分。

我们认为特征提取的部分是具有共性的部分，可以原封不动的进行迁移，而分类器的参数与具体的分类任务有关，通常我们需要进行改变，特别注意的地方是，我们一般都要改变最后一个输出层

2. Pytorch中的Finetune

模型微调步骤：
1. 获取与训练模型参数（原任务中学习到的知识）
2. 加载模型（load_state_dict）
3. 修改输出层
模型微调训练方法：

固定预训练的参数（requires_grad = False; lr=0）

for param in resnet18_ft.parameters():
    param.requires_grad = False

Features Extractor设置较小的学习率，而classifer的学习率可以比较大（可以通过params_group方法对不同部分设置不同的学习率）

fc_params_id = list(map(id, resnet18_ft.fc.parameters()))     # 返回的是parameters的 内存地址
"""将网络层中的参数分为fc层参数和features extractor部分参数，通过filter函数实现"""
base_params = filter(lambda p: id(p) not in fc_params_id, resnet18_ft.parameters())
optimizer = optim.SGD([
    {'params': base_params, 'lr': LR*0.1},   # 如果将LR设置为0，则不改变模型参数
    {'params': resnet18_ft.fc.parameters(), 'lr': LR}], momentum=0.9)