TensorFlow 2.0 初学者入门指南：从零构建图像分类模型

原创于 2025-05-14 09:48:48 发布 · 351 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#tensorflow #分类 #人工智能

tensorflow 专栏收录该内容

2 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

TensorFlow 2.0 初学者入门指南：从零构建图像分类模型

摘要

本文为 TensorFlow 2.0 的初学者提供了一个完整的入门教程。通过使用 Keras API，我们将详细介绍如何加载数据集、构建神经网络模型、训练模型以及评估模型性能。我们将以 MNIST 手写数字数据集为例，逐步展示如何从零开始构建一个图像分类器，并最终实现超过 98% 的准确率。本文旨在帮助初学者快速掌握 TensorFlow 2.0 的核心概念和操作，为进一步学习深度学习打下坚实基础。

1. 引言

TensorFlow 是一个广泛使用的开源机器学习框架，支持从简单的线性回归到复杂的深度学习模型的开发。TensorFlow 2.0 在 1.x 版本的基础上进行了重大改进，引入了 Keras API，使得模型构建和训练更加简洁高效。本文将通过一个完整的示例，帮助初学者快速上手 TensorFlow 2.0。

2. 环境设置

在开始之前，确保你已经安装了 TensorFlow 2.0。如果你使用的是 Google Colab，可以直接在浏览器中运行代码，无需手动安装。如果你在本地开发环境中操作，请确保已安装最新版本的 pip，并运行以下命令安装 TensorFlow 2.0：

pip install tensorflow

在 Python 程序中导入 TensorFlow：

import tensorflow as tf

3. 加载数据集

MNIST 数据集是一个经典的手写数字数据集，包含 60,000 张训练图像和 10,000 张测试图像，每张图像的大小为 28×28 像素。TensorFlow 提供了内置的 MNIST 数据集加载器：

mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()

为了提高模型的训练效率，我们需要将图像数据从整数转换为浮点数，并归一化到 [0, 1] 范围：

x_train, x_test = x_train / 255.0, x_test / 255.0

4. 构建模型

TensorFlow 2.0 中的 Keras API 提供了简洁的 API 来构建模型。我们将使用 tf.keras.Sequential 构建一个简单的神经网络模型，该模型包含以下层：

Flatten 层：将输入的 28×28 图像展平为一维数组。
Dense 层：包含 128 个神经元，激活函数为 ReLU。
Dropout 层：随机丢弃 20% 的神经元，防止过拟合。
Dense 层：输出层，包含 10 个神经元，对应 10 个数字类别。

model = tf.keras.models.Sequential([
  tf.keras.layers.Flatten(input_shape=(28, 28)),
  tf.keras.layers.Dense(128, activation='relu'),
  tf.keras.layers.Dropout(0.2),
  tf.keras.layers.Dense(10)
])

模型的输出是一个包含 logits（log-odds 分数）的向量，每个类别对应一个分数。为了将 logits 转换为概率，可以使用 tf.nn.softmax 函数：

predictions = model(x_train[:1]).numpy()
tf.nn.softmax(predictions).numpy()

5. 定义损失函数和优化器

为了训练模型，我们需要定义一个损失函数和优化器。损失函数用于衡量模型的预测值与真实值之间的差异，优化器用于调整模型的参数以最小化损失。

我们使用 SparseCategoricalCrossentropy 损失函数，它适用于多分类问题，接受 logits 向量和真实标签索引，并返回每个样本的标量损失：

loss_fn = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True)

在训练之前，使用 model.compile 方法配置模型，指定优化器、损失函数和评估指标：

model.compile(optimizer='adam',
              loss=loss_fn,
              metrics=['accuracy'])

6. 训练模型

使用 model.fit 方法训练模型，指定训练数据、训练轮数（epochs）等参数：

model.fit(x_train, y_train, epochs=5)

训练过程中，模型会自动调整参数以最小化损失函数，并在每个 epoch 结束时输出训练损失和准确率。

7. 评估模型

训练完成后，使用测试集评估模型的性能：

model.evaluate(x_test, y_test, verbose=2)

如果一切顺利，你的模型应该能够达到 98% 以上的准确率。

8. 输出概率

如果你希望模型输出每个类别的概率，可以将 softmax 层附加到模型上：

probability_model = tf.keras.Sequential([
  model,
  tf.keras.layers.Softmax()
])

然后使用 probability_model 对测试数据进行预测：

probability_model(x_test[:5])

9. 结论

通过本文的介绍，你已经成功使用 TensorFlow 2.0 和 Keras API 构建了一个简单的图像分类器。我们从加载数据集开始，逐步构建模型、训练模型，并最终评估模型性能。希望本文能帮助你快速掌握 TensorFlow 2.0 的基本操作，为进一步学习深度学习打下坚实基础。

如果你对 TensorFlow 有更深入的兴趣，可以查阅官方文档或尝试更复杂的模型和数据集。

您可能感兴趣的与本文相关的镜像

TensorFlow-v2.15

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。它提供了一个灵活的平台,用于构建和训练各种机器学习模型