项目二 CIFAR10与ImageNet图像识别(二)

本文详细介绍了使用TensorFlow训练CIFAR10数据集的图像识别模型过程,包括数据增强技巧、模型构建原理及关键代码实现,如随机剪裁、翻转、亮度对比度调整,以及卷积神经网络和全连接层的搭建。

2.使用tensorflow训练CIFAR10识别模型

2.1数据增强

    通过平移、旋转、翻转、裁剪、缩放、颜色变换等数据操作可以增加数据库的数量,同时也能大大提高模型的泛化能力,并且可以预防过拟合。在应用这个方法的时候,我们可以使用以下方法:

# 随机剪裁
distorted_image = tf.random_crop(reshaped_image, [height, width, 3])
# 随机翻转,50%水平翻转
distorted_image = tf.image.random_flip_left_right(distorted_image)
# 随机改变亮度对比度
distorted_image = tf.image.random_brightness(distorted_image,
                                               max_delta=63)
distorted_image = tf.image.random_contrast(distorted_image,
                                             lower=0.2, upper=1.8)

2.2CIFAR识别模型构建

    这一步,就在创建用于识别的神经网络,tensorflow给出的代码很好,没有什么可以修改的地方。原理即是两次的卷积网络加两次全连接转到softmax.

2.3一些小知识点

    1.tf.gfile.Exists(FLAGS.train_dir)是用来确定train_dir是否存在的命令

    2.tf.contrib.framework.get_or_create_global_step()用来生成系统运行步数(tensor结构)

    3.epoch是所有样本的数量,batch是训练一个step中所要用的样本的数量,而batch_size*global_step=epoch

    例如batch_size=16,epoch为1024,则经过64个step就完成一个epoch,则打乱epoch进行第二个epoch

    4.对于这一部分:

  with tf.control_dependencies([loss_averages_op]):
    opt = tf.train.GradientDescentOptimizer(lr)
    grads = opt.compute_gradients(total_loss)

  # Apply gradients.
  apply_gradient_op = opt.apply_gradients(grads, global_step=global_step)

    则是要自己处理一下计算完成的梯度,并之后赋值给variable

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值