记录一下Tensorflow下实现DCNN的迁移学习（即冻结固定层，只训练某几层）

最新推荐文章于 2024-06-21 02:43:18 发布

原创最新推荐文章于 2024-06-21 02:43:18 发布 · 2.6k 阅读

14 ·

CC 4.0 BY-SA版权

tensorflow 同时被 2 个专栏收录

6 篇文章

订阅专栏

迁移学习

1 篇文章

订阅专栏

1.基本概念：

迁移学习是在已经训练好的模型下，恢复这些训练好的模型参数到我们的新模型中，新模型使用的数据集一般比较少时，我们可以根据新数据集与原数据集的相似程度，数据规模大小等冻结网络的某几个卷积层，只训练最后的全连接层或者平均池化层，加快了训练速度，同时提升模型的泛化能力。

2.主要思路：

（1）准备基模型

首先需要一个提前训练好的模型文件。这里是我的文件目录。我们称为“基模型”。
在这里插入图片描述

（2）查询变量

查询变量的作用域并保存这个基模型的所有参数。方便后期迁移学习后对比模型的参数是否发生变化，是否按照我们冻结的层次进行的训练。主要代码如下：

import os
from tensorflow.python import pywrap_tensorflow

model_dir = os.getcwd() # 获取当前文件工作路径

checkpoint_path = r'D:\桌面\model\TrainInceptionV3-87000' #基模型的文件路径

#print(checkpoint_path)
reader = pywrap_tensorflow.NewCheckpointReader(checkpoint_path)
var_to_shape_map = reader.get_variable_to_shape_map()
Tag = False
var = []
for key in var_to_shape_map:
    if key.startswith("Variable") and Tag:  # Tag ==True 只显示不是网络权重的变量
        var.append(key)

    elif not Tag:  # 显示所有变量及对应的值
        if "weight" in key:
            print('tensor_name', key)
            with open('old_weights.txt','a+',newline='',encoding='utf-8') as w:
            w.write(key+'\n')
            w.write(str(reader.get_tensor(key))+'\n')
var.sort()
for v in var:
    print('tensor_name', v)  # ,": ",len(reader.get_tensor(v)))

3.查看权重

权重保存到txt文件完成后，我们可以查看这个文件：
在这里插入图片描述
这是我们的一部分权重参数。

（4）定义优化参数

在训练的代码中添加需要参与优化的参数，也就是需要冻结哪些参数，只训练哪些参数。因此，我们在进行损失函数的定义前，增加如下代码：

update_vars_list=[] #这里是需要更新的参数项
tvars=tf.trainable_variables()
for tvar in tvars:
    if "Logits" in tvar.op.name:
        update_vars_list.append(tvar)#只训练InceptionV3模型的辅助分类器和最终的分类器那一段（即包含了Logits这个作用域的变量）
    else：
        pass