图像分类笔记

本文提供CIFAR-10数据集的下载链接与详细格式说明,汇总了训练精度评测资源,并介绍了使用TensorFlow进行图像分类实验的方法,包括数据增强、多GPU训练及评估过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

cifar下载地址:
http://www.cs.toronto.edu/~kriz/cifar.html
http://www.cs.toronto.edu/~kriz/cifar-10-binary.tar.gz 162 MB
http://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz 163 MB
此外还有matlab版,都不是图片原文件,格式为data_batch_1, data_batch_2, …, data_batch_5, 以及test_batch,每个10000条数据
data为100003072,labels为100001(0-9),label_names 存每个标签对应的物体名称(如label_names[0] == “airplane”)
1字节label+3072字节像素值=3073字节,没有多余分隔符

cifar准确率汇总:
http://rodrigob.github.io/are_we_there_yet/build/classification_datasets_results.html

cifar10官网代码:
https://github.com/tensorflow/models/tree/master/tutorials/image/cifar10
https://github.com/tensorflow/models/tree/master/tutorials/image/cifar10_estimator(多GPU版)

tf官网介绍cifar10:
https://www.tensorflow.org/tutorials/images/deep_cnn

###########图像分类实验################

cifar10图像分类(支持一个或多个GPU;貌似不能直接在tpu上跑,tpu的代码、接口都不一样,可以看下D:\tensorflow_models\models-master\official\mnist的mnist_tpu.py)

  1. python cifar10_train.py --train_dir cifar10_train/ --data_dir cifar10_data/
    colab gpu(Tesla K80)上:2622.4 examples/sec; 0.049 sec/batch;5s100步,100万步需要14h,10万步需要1.4h
    本地cpu:229.5 examples/sec; 0.558 sec/batch;大概是10倍多速度
    说明:会自动下载数据集,并进行数据增强(包括随机左右翻转、随机裁剪、随机调整亮度和对比度);

  2. python cifar10_eval.py --data_dir cifar10_data/ --eval_dir cifar10_eval/ --checkpoint_dir cifar10_train/
    结果为:precision @ 1 = 0.864(10万步)
    注意:如果run_once为false,那么eval会一直运行,并隔一段时间(eval_interval_secs)测一遍最新的检查点,中间会sleep
    gpu训练得到的checkpoint在cpu上也是能eval的

训练自己的图像识别模型用slim模块(可使用迁移学习进行微调),只需根据自己的数据集制作tfrecord,并修改、添加部分代码即可,直接用现成的py,可指定只训练哪些层或全部训练,可对单张图像进行预测;

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值