迁移学习（Transfer Learning）

最新推荐文章于 2025-02-08 21:13:54 发布

原创最新推荐文章于 2025-02-08 21:13:54 发布 · 1.5k 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

深度学习同时被 2 个专栏收录

17 篇文章

订阅专栏

计算机视觉

2 篇文章

订阅专栏

本文介绍了一种名为微调的技术，该技术通过利用源数据集上预训练的模型权重来加速和改进目标数据集上的模型训练过程。具体步骤包括：1. 在源数据集上训练神经网络A；2. 创建新网络B并复制A除输出层外的所有参数；3. 为B添加适合目标数据集的输出层；4. 在目标数据集上训练B，同时对除输出层外的层进行微调。

将从源数据集学到的知识迁移到目标数据集上

微调（fine tuning）

微调通过将模型部分权重初始化成在源数据集上预训练的模型权重，从而将模型在源数据集上学到的知识迁移到目标数据上。

在源数据（例如 ImageNet）上训练一个神经网络 A。
创建一个新的神经网络 B，它复制了 A 上除了输出层外的所有模型参数。我们假设这些模型参数含有源数据上学习到的知识，且这些知识同样适用于目标数据集。但最后的输出层跟源数据标注紧密相关，所以不被重用。
为 B 添加一个输出大小为目标数据集类别数目（例如一百类椅子）的输出层，并将其权重初始化成随机值。
在目标数据集（例如椅子数据集）上训练 B。我们将从头开始学习输出层，但其余层都是基于源数据上的模型参数进行微调。

这里写图片描述

微调的网络中的主要层的已经训练的足够好，所以一般采用比较小的学习率，防止过大的步长对训练好的层产生过多影响。

微调的模型因为初始值更好，在相同迭代周期下能够取得更好的结果。在很多情况下，微调的模型最终也会比非微调的模型取得更好的结果。

http://zh.gluon.ai/chapter_computer-vision/fine-tuning.html

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。