迁移学习&domain adaption

最新推荐文章于 2025-11-14 15:29:24 发布

原创最新推荐文章于 2025-11-14 15:29:24 发布 · 4.3k 阅读

13 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习

神经网络&深度学习专栏收录该内容

59 篇文章

订阅专栏

本文介绍了迁移学习的基本概念，重点讨论了在卷积神经网络（CNN）中的应用方法。包括从头学习、特征提取及微调等技术，并提出了选择合适迁移学习方法的依据。同时，文章还提供了一些实用建议。

一概念：

（1）learning from scratch 即学一个CNN网络with random initialization

(2) 在新的学习任务中，可以利用现有训练好的imagenet网络提取特征，去掉最后一个分类的全连接层，在classifier层之前提取4096维的特征，这些特征称为CNN code

（3）在CNN网络结构中，前面的卷积层保留更多的普遍特征 generic features（edge detectors 或者corlor blob detectors)，后面的卷积层包含更多的 task specific 特征

二迁移学习的两种方法：

（1）利用已有的model提取特征，后面再训练分类器，比如linear svm或者softmax classifier。

（2）finetune 已有的model：即在已训练好参数的CNN结构上，利用自己的数据进行back propagation, finetune网络已有的weights.

(可以finetune 整个CNN ,也可以保持前面的一些层的参数不变，只finetune网络的高层部分，这样做可以防止过拟合）

三迁移学习方法的选择：

主要取决于数据集的大小，以及与之前预训练数据集的相关性

（1）数据集很小，与预训练数据集相似: 直接提特征，提最后一层的CNN code, 训练linear 分类器

(2) 数据集很小，与预训练数据集不同：在前面的网络层中提feature,训练线性分类器

（3）数据集很大，与预训练数据相似：finetune 整个网络层

（4）数据集很大，与预训练数据不同：可以learning from scratch，也可以在预训练的model上finetune

四一些实用的建议：

（1）finetune的时候输入图片的大小不受限制，因为forward function的与输入的spatial 大小无关，只要stride能fit

（2）把需要finetune的网络层的学习率设低一点：因为我们默认预训练的model的参数已经很好了，因此在finetune优化的时候采取小的学习率

迁移学习

CNN for Visual Rcognition --- Stanford 2015 （二）

迁移学习的相关概念

迁移学习论文杂读（门外汉级）

Sinno Jialin Pan, Qiang Yang, A Survey on Transfer Learning, IEEE Transactions on Knowledge and Data Engineering (IEEE TKDE)

此外在下面的这个链接中还有一些开源的软件和数据库：

http://www.cse.ust.hk/TL/index.html

迁移学习（ Transfer Learning ）

https://kwotsin.github.io/tech/2017/02/11/transfer-learning.html