一起来用tf.data API!(3)——TFRecords是什么?
(一)简 介
(二)TFRecords可接受的数据格式
(三)生成TFRecords的基本流程
(四)总 结
(一)简 介
TFRecords是TensorFlow专用的数据文件格式,其中包含了tf.train.Example协议内存块(protocol buffer),这是只包含特征值与数据内容的一种数据格式。通过tf.python_io.TFRecordWriter类,可以获取相应的数据并将其填入到Example协议内存块中,最终生成TFRecords文件。TFRecords就是通过一个包含着二进制文件的数据文件,将特征和标签进行保存以便于TensorFlow读取。
(二)TFRecords可接受的数据格式
TFRecords可接受三种数据格式:

通过以下代码对其进行演示:
从上面的代码段可以看到,a_data,b_data以及c_data是三种不同类型的数据。a_data为float类型,因此在写入的时候使用FloatList格式,b_data用作列表的写入;而对于其他类型的数据,例如数组或者字符串,则需要统一设置成二进制的形式进行写入。
(三)生成TFRecords的基本流程
下面的代码段演示了TFRecords写入文件的基本格式:
基本流程为:
-
创建一个写入文件的writer
-
定义样本example,其中包含要写入的数据的标签及数据的类型
-
将数据转换为二进制形式并写入
(四)总 结
在本节中我们介绍了TFRecords文件是什么,可接受的数据类型和制作TFRecords文件的基本流程,在下一节中我们将使用图像数据制作TFRecords文件,有任何的疑问可以在评论区留言,我会尽快回复,谢谢支持!
本文深入解析TFRecords文件格式,介绍其数据存储方式与制作流程。TFRecords是TensorFlow专用的数据文件,采用tf.train.Example协议内存块存储特征与标签,支持float、列表与二进制数据。文章详细阐述了生成TFRecords的步骤,包括创建writer、定义example以及数据转换。
6921

被折叠的 条评论
为什么被折叠?



