深度学习之模型finetuning

最新推荐文章于 2025-04-21 13:53:03 发布

转载最新推荐文章于 2025-04-21 13:53:03 发布 · 385 阅读

本文探讨了在小数据集上应用深度学习时如何避免过拟合现象，并介绍了一种有效的解决方案——fine-tuning。通过调整预训练模型的最后几层来适应特定任务，同时保留了底层的基础特征提取能力。文章还提供了选择合适预训练模型和调整学习率的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.先说明finetuning在什么情况下使用

-- 借用cs231n课程的图，当数据量较小时，运用深度学习这一神器很可能会出现过拟合的现象，但是又想运用训练的灰常好的如VGGNet、GoogleNet等预训练模型时，可以只对于网络最后面的几层进行重新训练，对于神经网络的底层，因为它充分的在大数据集上进行了基础特征的提取如：颜色、边框等，依旧可以在我们的数据集合上进行运用。当然在进行fine-tuning时，不要盲目的选择预训练模型，可以根据你的数据量、图片数据的特征等（如下表格所示）选择合适的、接近你数据的预训练模型，并且选择合适的需要进行较大重新训练的层和基本不用动的层。