PyTorch 1.0 中文官方教程：torch.nn 到底是什么？

最新推荐文章于 2025-05-08 12:11:49 发布

翻译最新推荐文章于 2025-05-08 12:11:49 发布 · 3.8w 阅读

ApacheCN 专栏收录该内容

228 篇文章

订阅专栏

本教程通过逐步引入PyTorch的高级特性，如torch.nn、torch.optim、Dataset和DataLoader，演示如何从零开始构建并优化神经网络模型。以MNIST数据集为例，详细解释了如何使用这些模块提升模型效率。

部署运行你感兴趣的模型镜像

译者：lhc741

作者：Jeremy Howard，fast.ai。感谢Rachel Thomas和Francisco Ingham的帮助和支持。

我们推荐使用notebook来运行这个教程，而不是脚本，点击这里下载notebook(.ipynb)文件。

Pytorch提供了torch.nn、torch.optim、Dataset和DataLoader这些设计优雅的模块和类以帮助使用者创建和训练神经网络。
为了最大化利用这些模块和类的功能，并使用它们做出适用于你所研究问题的模型，你需要真正理解他们是如何工作的。
为了做到这一点，我们首先基于MNIST数据集训练一个没有任何特征的简单神经网络。
最开始我们只会用到PyTorch中最基本的tensor功能，然后我们将会逐渐的从torch.nn，torch.optim，Dataset，DataLoader中选择一个特征加入到模型中，来展示新加入的特征会对模型产生什么样的效果，以及它是如何使模型变得更简洁或更灵活。

在这个教程中，我们假设你已经安装好了PyTorch，并且已经熟悉了基本的tensor运算。(如果你熟悉Numpy的数组运算，你将会发现这里用到的PyTorch tensor运算和numpy几乎是一样的)

MNIST数据安装

我们将要使用经典的MNIST数据集，这个数据集由手写数字（0到9）的黑白图片组成。

我们将使用pathlib来处理文件路径的相关操作（python3中的一个标准库），使用request来下载数据集。
我们只会在用到相关库的时候进行引用，这样你就可以明确在每个操作中用到了哪些库。

from pathlib import Path
import requests

DATA_PATH = Path("data")
PATH = DATA_PATH / "mnist"

PATH.mkdir(parents=True, exist_ok=True)

URL = "http://deeplearning.net/data/mnist/"
FILENAME = "mnist.pkl.gz"