pytorch如何freeze模型参数

最新推荐文章于 2024-11-07 15:29:20 发布

原创最新推荐文章于 2024-11-07 15:29:20 发布 · 8.5k 阅读

4 ·

CC 4.0 BY-SA版权

Torch 专栏收录该内容

2 篇文章

订阅专栏

本文介绍了在PyTorch中如何冻结和解冻模型参数，这对于迁移学习和自监督学习至关重要。通过提供的函数`set_freeze_by_names`和`set_freeze_by_idxs`，可以根据层名或索引来方便地控制模型参数是否参与反向传播。这些函数允许用户选择性地更新模型的特定部分，在预训练模型上进行微调或专注于训练新添加的层。

部署运行你感兴趣的模型镜像

pytorch如何freeze模型参数

在做迁移学习或者自监督学习时，一般先预训练一个模型，再将该模型参数作为目标任务模型的初始化参数，或者直接freeze预训练模型，不再更新其参数。

今天记录下如何pytorch freeze模型参数

我是参考知乎一个文章，总结的很完整，我直接拿过来用了，原文出处为

https: // www.zhihu.com / question / 311095447 / answer / 589307812

from collections.abc import Iterable


def set_freeze_by_names(model, layer_names, freeze=True):
    if not isinstance(layer_names, Iterable):
        layer_names = [layer_names]
    for name, child in model.named_children():
        if name not in layer_names:
            continue
        for param in child.parameters():
            #print(param.name)
            param.requires_grad = not freeze


def freeze_by_names(model, layer_names):
    set_freeze_by_names(model, layer_names, True)


def unfreeze_by_names(model, layer_names):
    set_freeze_by_names(model, layer_names, False)


def set_freeze_by_idxs(model, idxs, freeze=True):
    if not isinstance(idxs, Iterable):
        idxs = [idxs]
    num_child = len(list(model.children()))
    idxs = tuple(map(lambda idx: num_child + idx if idx < 0 else idx, idxs))
    for idx, child in enumerate(model.children()):
        if idx not in idxs:
            continue
        for param in child.parameters():
            param.requires_grad = not freeze


def freeze_by_idxs(model, idxs):
    set_freeze_by_idxs(model, idxs, True)


def unfreeze_by_idxs(model, idxs):
    set_freeze_by_idxs(model, idxs, False)

您可能感兴趣的与本文相关的镜像