TensorFlow2.0入门到进阶系列——4_Tf.data_API使用

最新推荐文章于 2021-01-31 20:35:20 发布

原创

最新推荐文章于 2021-01-31 20:35:20 发布 · 675 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #人工智能 #python #csv

本文介绍了TensorFlow2.0中tf.data API的基础使用，包括从csv文件和tfrecord文件中读取数据，使用decode_csv解析csv，以及repeat、batch、shuffle等操作。详细探讨了如何构建和操作Dataset实例，如将输入参数转换为元组或字典，以及Example的序列化和解析。

Dataset表示一系列元素的集合。其中的每个元素可以是单个或者多个Tensor对象。此外，Dataset包含了一系列作用于这些元素上的操作，包含map、flat_map、filter、repeat、shuffle、skip、take等，这类似于Spark中的RDD。

在这里插入图片描述

1、文章内容

Dataset基础API使用
Dataset读取csv文件
Dataset读取tfrecord文件

2、API列表

Dataset基础使用
- tf.dataDataset.from_tensor_slices
- repeat,batch,interleave,map,shuffle,list_files
csv
- tf.data.TextLineDataset,tf.io.decode_csv
Tfrecord
- tf.train.FloatList,tf.train.Int64List,tf.train.BytesList
- tf.train.Feature,tf.train.Features,tf.train.Example
- example.SerializeToString
- tf.io.ParseSingleExample
- tf.io.VarLenFeature,tf.io.FixedLenFeature
- tf.data.TFRecordDataset,tf.io.TFRecordOptions

2.1、dataset基本使用方法

dataset基本使用方法：利用内存中的数据构造dataset，进行变化

import matplotlib as mpl
import matplotlib.pyplot as plt
%matplotlib inline
import numpy as np
import sklearn
import pandas as pd
import os
import sys
import time
import tensorflow as tf

from tensorflow import keras
#import keras

print(tf.__version__)
print(sys.version_info)
for module in mpl,np,pd,sklearn,tf,keras:
    print(module.__name__,module.__version__)

在这里插入图片描述

#从内存中构建数据集
dataset = tf.data.Dataset.from_tensor_slices(np.arange(10))
print(dataset)

在这里插入图片描述

#遍历dataset
for item

最低0.47元/天解锁文章

TensorFlow2.0入门到进阶系列——4_Tf.data_API使用

4_Tf.data_API使用

1、文章内容

2、API列表

2.1、dataset基本使用方法

2 条评论