【TensorFlow】将数据集保存为TFRecords格式的文件

TFRecords是TensorFlow推荐的数据存储格式,便于数据处理。本文介绍了如何使用tf.python_io将数据写入TFRecords文件,以及tf.train.Example在格式转换中的作用,包括BytesList、Int64List和FloatList的使用。通过将数据转换为tf.train.Feature和tf.train.Example,最终序列化为字符串写入文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

tf.python_io介绍

tf.train.Example介绍


TFRecords是TensorFlow官方推荐的存储数据的格式,方便对数据存储转移以及操作。

一个TFRecords文件包含一个带有CRC散列的字符串序列,其存储格式有如下四种:

uint64 length
uint32 masked_crc32_of_length
byte   data[length]
uint32 masked_crc32_of_data

tf.python_io介绍

                with tf.python_io.TFRecordWriter(output_filename) as tf_writer:
                    start_ndx =shard_id * num_per_shard
                    end_ndx = min((shard_id+1) * num_per_shard, len(file_names))
                    for i in range(start_ndx, end_ndx):

首先是定义输入文件的位置以及名称 output_filename。

通过 tf.python_io,将数据写入文件,用with打开的话,在写入结束之后后自动关闭文件,不用再特意写一个关闭文件的语句了,这个操作与python打开文件的操作是一样的。

                        example = data_utils.image_to_tfexample(image,  b'jpg', he
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值