计算机视觉中的深度学习:微调与可视化
1. 模型微调(Fine - tuning)
模型微调是一种与特征提取互补的模型复用技术。它的核心是解冻用于特征提取的冻结模型基础的顶部几层,然后联合训练新添加的模型部分(如全连接分类器)和这些顶部层。这样做的目的是稍微调整被复用模型的更抽象表示,使其更适应当前的问题。
1.1 微调步骤
微调网络的步骤如下:
1. 在已训练的基础网络之上添加自定义网络。
2. 冻结基础网络。
3. 训练添加的部分。
4. 解冻基础网络中的一些层。
5. 联合训练这些解冻的层和添加的部分。
在进行特征提取时,通常已经完成了前三个步骤。接下来以VGG16网络为例,进行步骤4的操作,即解冻 conv_base 并冻结其中的个别层。
conv_base.trainable = True
set_trainable = False
for layer in conv_base.layers:
if layer.name == 'block5_conv1':
set_trainable = True
if set_trainable:
layer.trainable = True
else:
layer.trainable = False
1.2 选择微调层的考虑因素
为什么不微调更多层,甚至不微调整个卷积基础呢?主要有以下两个原因:
-
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



