TensorFlow 2.x中shuffle函数和batch函数调用顺序影响

最新推荐文章于 2022-04-12 10:58:16 发布

原创最新推荐文章于 2022-04-12 10:58:16 发布 · 705 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#tensorflow #深度学习

TensorFlow 专栏收录该内容

4 篇文章

订阅专栏

探讨TensorFlow2.x中shuffle与batch函数调用顺序对训练集随机取样的影响。先shuffle后batch按样本打乱；先batch后shuffle则按批次打乱。shuffle不影响样本标签对应。

部署运行你感兴趣的模型镜像

TensorFlow 2.x中shuffle函数和batch函数调用顺序影响

探究TensorFlow 2.x版本中，shuffle函数和batch函数调用顺序对训练过程中随机取样结果的影响。

先shuffle，再batch

代码如下：

import tensorflow as tf

x_train = tf.range(0, 10)
y_train = tf.range(5, 15)
dataset = tf.data.Dataset.from_tensor_slices((x_train, y_train))

dataset = dataset.shuffle(10)
dataset = dataset.batch(5)
for epoch in range(10):
    for step, (x, y) in enumerate(dataset):
        print(f"step:{step}, x:{x.numpy()}, y:{y.numpy()}, y-x:{y.numpy()-x.numpy()}")
    print()

输出结果如下：

先shuffle，再batch的输出结果图

先batch，再shuffle

代码如下：

import tensorflow as tf

x_train = tf.range(0, 10)
y_train = tf.range(5, 15)
dataset = tf.data.Dataset.from_tensor_slices((x_train, y_train))

dataset = dataset.batch(5)
dataset = dataset.shuffle(10)
for epoch in range(10):
    for step, (x, y) in enumerate(dataset):
        print(f"step:{step}, x:{x.numpy()}, y:{y.numpy()}, y-x:{y.numpy()-x.numpy()}")
    print()

输出结果如下：

先batch，再shuffle的输出结果图