Tensorflow 2.x
用同一个语句,差一行代码。
以mdb_reviews为例,
本地的话,提前下载解压到
C:\\Users\\Grant\\tensorflow_datasets\\imdb_reviews\\plain_text\\1.0.0,
但是传给load函数的目录是前半部分C:\\Users\\Grant\\tensorflow_datasets\\,
后半部分tfds自动拼接,因为tfds代码库内建数据集操作类代码和特征字典。
以下代码在linux ,win10下测试通过。看工作代码:
####======================load from local =========================
# import os
#windows 10
#text_dir='C:\\Users\\Grant\\tensorflow_datasets\\'
#linux
text_dir='/root/data/'
## 目录自动添加 imdb_reviews\\plain_text\\1.0.0
dataset, info = tfds.load('imdb_reviews', download=False,data_dir=text_dir, with_info=True,as_supervised=True)
#print("data_dir:",text_dir)
####===============================================================
tfds.load: 一行代码获取数据集,
tfds.load 是构建并加载 tf.data.Dataset 最简单的方式。
tf.data.Dataset 是构建输入流水线的标准 TensorFlow 接口。
本文介绍了如何在Tensorflow2.x中利用tfds.load函数加载本地数据集,特别是在Windows和Linux环境下设置数据目录的方法。通过指定数据目录,可以避免下载并结合tfds内部处理自动完成数据集加载。同时,`tf.data.Dataset`作为构建输入流水线的标准接口,简化了数据处理流程。
1792

被折叠的 条评论
为什么被折叠?



