1. 数据准备与预处理:
-
加载数据:使用内置数据集或自定义数据。
-
预处理:归一化、调整维度、数据增强。
-
划分数据集:训练集、验证集、测试集。
-
转换为Dataset对象:利用
tf.data
优化数据流水线。
import tensorflow as tf
from tensorflow.keras import layers
# 加载MNIST数据集
(x_train, y_train), (x_test, y_test) = tf.keras.datasets.mnist.load_data()
# 数据预处理:归一化并添加通道维度
x_train = x_train[..., tf.newaxis].astype('float32') / 255.0
x_test = x_test[..., tf.newaxis].astype('float32') / 255.0
# 划分验证集(10%训练集作为验证)
val_split = 0.1
val_size = int(len(x_train) * val_split)
x_val, y_val = x_train[:val_size], y_train[:val_size]
x_train, y_train = x_train[val_size:], y_train