Tensorflow Inception-v3模型迁移学习

这篇博客记录了使用Tensorflow的Inception-v3模型进行迁移学习的过程,详细展示了随着训练步数增加,验证集上的准确率逐步提升,最终稳定在94%左右,显示出模型的良好性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

"""
@author:  wangquaxiu
@time:  2018/8/27 19:13
"""
import glob
import os.path
import random
import numpy as np
import tensorflow as tf
from tensorflow.python.platform import  gfile

# Inception-v3模型瓶颈层的节点个数
BOTTLENECK_TENSOR_SIZE = 2048

# Inception-v3模型中代表瓶颈层结果的张量名称。在谷歌提供的Inception-v3模型中,这
# 个张量名称就是'pool_3/_reshape:0'。在训练模型时,可以通过tensor.name来获取张量的名称。
BOTTLENECK_TENSOR_NAME = 'pool_3/_reshape:0'

# 图像输入张量多对应的名称。
JPEG_DATA_TENSOR_NAME = 'DecodeJpeg/contents:0'

# 下载的谷歌训练好的Inception-v3模型文件目录。
MODEL_DIR = 'path/to/model'

# 下载的谷歌训练好的Inception-v3模型文件名
MODEL_FILE = 'tensorflow_inception_graph.pb'

# 因为一个训练数据会被使用多次,所以可以将原始图像通过Inception-v3模型计算得到
# 的特征向量保存在文件中,免去重复计算。下面的变量定义了这些文件的存放地址。
CACHE_DIR = 'tmp/bottlebeck'

# 图片数据文件夹。在这个文件夹中每一个子文件夹代表了一个需要区分的类别,每个子文件夹中
# 存放了对应类别的图片。
INPUT_DATA = 'path/to/flower_data'

# 验证的数据百分比。
VALIDATION_PERCENTAGE = 10

# 测试的数据百分比
TEST_PRECENTAGE = 10

# 定义神经网络的设置。
LEARNING_RATE = 0.01
STEPS = 4000
BATCH = 100

# 这个函数从数据文件夹中读取所有的图片列表并按照训练、验证、测试数据分开。
# testing_percentage和validation_percentage参数指定了测试数据集和验证数据集的
# 大小
def create_image_lists(testing_percentage, validation_perscentage):
    # 得到的所有图片都存在result这个字典(dictionary)里。这个字典的key为类别名称,
    # value也是一个字典,字典里储存;了所有图片的名称。
    result = {}
    # 获取当前目录下所有的子目录。
    sub_dirs = [x[0] for x in os.walk(INPUT_DATA)]
    # 得到的第一个目录是当前目录,不需要考虑。
    is_root_dir = True
    for sub_dir in sub_dirs:
        if is_root_dir:
            is_root_dir = False
            continue

        # 获取当前目录下所有的有效图片文件
        extensions = ['jpg', 'jpeg', 'JPG', 'JPEG']
        file_list = []
        dir_name = os.path.basename((sub_dir))
        for extension in extensions:
            file_glob = os.path.join(INPUT_DATA, dir_name, '*.' + extension)
            file_list.extend(glob.glob(file_glob))
        if not file_list:
            continue

        # 通过目录名称获取类别的名称
        label_name = dir_name.lower()
        # 初始化当前类别的训练数据集、测试数据集和验证数据集。
        training_images = []
        testing_images = []
        validation_images = []
        for file_name in file_list:
            base_name = os.path.basename(file_name)
            # 随即将数据分到训练数据集、测试数据集和验证数据集。
            chance = np.random.randint(100)
            if chance < validation_perscentage:
                validation_images.append(base_name)
            elif chance < (testing_percentage + validation_perscentage):
                testing_images.append(base_name)
            else:
                training_images.append(base_name)

        # 将当前类别的数据放入结果字典。
        result[label_name] = {
            'dir': dir_name,
            'training': training_images,
            'testing': testing_images,
            'validation&
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值