TensorFlow2.0入门到进阶系列——4_Tf.data_API使用

本文介绍了TensorFlow2.0中tf.data API的基础使用,包括从csv文件和tfrecord文件中读取数据,使用decode_csv解析csv,以及repeat、batch、shuffle等操作。详细探讨了如何构建和操作Dataset实例,如将输入参数转换为元组或字典,以及Example的序列化和解析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


Dataset表示一系列元素的集合。其中的每个元素可以是单个或者多个Tensor对象。此外,Dataset包含了一系列作用于这些元素上的操作,包含map、flat_map、filter、repeat、shuffle、skip、take等,这类似于Spark中的RDD。

在这里插入图片描述

1、文章内容

  • Dataset基础API使用
  • Dataset读取csv文件
  • Dataset读取tfrecord文件

2、API列表

  • Dataset基础使用
    • tf.dataDataset.from_tensor_slices
    • repeat,batch,interleave,map,shuffle,list_files
  • csv
    • tf.data.TextLineDataset,tf.io.decode_csv
  • Tfrecord
    • tf.train.FloatList,tf.train.Int64List,tf.train.BytesList
    • tf.train.Feature,tf.train.Features,tf.train.Example
    • example.SerializeToString
    • tf.io.ParseSingleExample
    • tf.io.VarLenFeature,tf.io.FixedLenFeature
    • tf.data.TFRecordDataset,tf.io.TFRecordOptions

2.1、dataset基本使用方法

  • dataset基本使用方法:利用内存中的数据构造dataset,进行变化
import matplotlib as mpl
import matplotlib.pyplot as plt
%matplotlib inline
import numpy as np
import sklearn
import pandas as pd
import os
import sys
import time
import tensorflow as tf

from tensorflow import keras
#import keras

print(tf.__version__)
print(sys.version_info)
for module in mpl,np,pd,sklearn,tf,keras:
    print(module.__name__,module.__version__)

在这里插入图片描述

#从内存中构建数据集
dataset = tf.data.Dataset.from_tensor_slices(np.arange(10))
print(dataset)

在这里插入图片描述

#遍历dataset
for item in dataset:
    
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值