在本文中,我们将使用 TensorFlow 和 Keras 实现一个简化版的 GoogLeNet 模型来进行 MNIST 数据集的手写数字分类任务。GoogLeNet 采用了 Inception 模块,这使得它在处理图像数据时能更高效地提取特征。本教程将详细介绍如何在 MNIST 数据集上训练和测试这个模型。
项目结构
我们的代码将分为两个部分:
- 训练部分 (
train.py
): 包含模型定义、数据加载、模型训练等。 - 测试部分 (
test.py
): 用于加载训练好的模型,并在测试集上评估其性能。
训练部分:train.py
1. 数据加载与预处理
首先,我们需要加载 MNIST 数据集并进行预处理。预处理包括调整图像形状、归一化以及 One-Hot 编码标签。
import tensorflow as tf
from tensorflow.keras.datasets import mnist
from tensorflow.keras.utils import to_categorical
def load_and_preprocess_data():
# 加载 MNIST 数据集
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()
# 数据预处理:将图像形状调整为 [28, 28, 1],并归一化到 [0, 1] 范围
train_images = train_images.reshape((train_images.shape[0], 28, 28, 1)) / 255.0
test_images = test_images.reshape((test_images.shape[0], 28, 28, 1)) / 255.0
# One-Hot 编码标签
train_labels = to_categorical(train_labels, 10)
test_labels = to_categorical(test_labels, 10)
return train_images, train_labels, test_images, test_labels
2. 创建简化版 GoogLeNet 模型
接下来,我们定义一个简化版的 GoogLeNet 模型。该模型包括卷积层、Inception 模块和全连接层。
from tensorflow.keras import layers, models
def googlenet(input_shape=(28, 28, 1), num_classes=10):