最近接触到制作数据集的知识,了解到TFRecords文件。记录笔记如下:
目录:
1.TFrecords文件介绍
2.将数据写入到TFRecords文件
3. 从TFRecords文件中读取数据***
一、TFRecords文件介绍
- 文件名:TFRecords文件是以 ** .tfrecords ** 为后缀
- 功能: 转化为TFRecords是为了将图片、标记等数据保存在本地(持久化),理解:就像文本文件一样 。
- 优点:
a.可以自定义数据集的存储方式,方便在训练/测试神经网络时数据的读取。
b.可以对大量的数据进行持久化。
c.暂不清楚(后续补充) - 缺点: 暂不清楚(后续补充)
二、写入到TFRecords文件
def productTFRs(save_tfrcordes_path):
'''
函数功能:将images和labels以TFReordes的形式存储
参数:是TFRecordes文件的存储路径
注意:很多地方必须要中括号"[]"
'''
print("正在将图片保存为TfRecords格式...")
# 1.新建一个writer
writer = tf.python_io.TFRecordWriter(path=save_tfrcordes_path)
# getDatas()函数返回的是本地images和labels,且都是以二进制的形式存在
images, labels = getDatas()
process = 0 #打印进度
# 2.for循环遍历每张图片和标签
for image, label in zip(images, labels):
process += 1
# 3.把每张图片和标签封装到example中。如有不明,参考补充知识/code01.py
feature_dict =