李沐动手学深度学习第4章-4.2多层感知机的从零开始实现

这篇博客介绍了如何使用PyTorch从头开始实现一个多层感知机,特别是在Fashion-MNIST数据集上的应用。首先,定义了模型参数,包括一个隐藏层有256个单元的多层感知机。接着,实现了ReLU激活函数,定义了模型结构。然后,使用CrossEntropyLoss作为损失函数,并通过SGD优化器进行训练。最后,进行了模型的预测。
部署运行你感兴趣的模型镜像

现在让我们尝试自己实现一个多层感知机。 为了与之前softmax回归获得的结果进行比较, 我们将继续使用Fashion-MNIST图像分类数据集。

代码如下:

import torch
from torch import nn
from d2l import torch as d2l

batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

 1. 初始化模型参数

Fashion-MNIST中的每个图像由 28×28=784个灰度像素值组成。 所有图像共分为10个类别。 忽略像素之间的空间结构, 我们可以将每个图像视为具有784个输入特征10个类的简单分类数据集。 首先,我们将实现一个具有单隐藏层的多层感知机, 它包含256个隐藏单元

对于每一层我们都要记录一个权重矩阵和一个偏置向量。 跟以前一样,我们要为损失关于这些参数的梯度分配内存。

num_inputs, num_outputs, num_hiddens = 784, 10, 256

W1 = nn.Parameter(torch.randn(num_inputs, num_hiddens, requires_grad=True) * 0.01)
b1 = nn.Parameter(torch.zeros(num_hiddens, requires_grad=True))
W2 = nn.Parameter(torch.randn(num_hiddens, num_outputs, requires_grad=True) * 0.01)
b2 = nn.Parameter(torch.zeros(num_outputs, requires_grad=True))

params = [W1, b1, W2, b2]

2. 激活函数

为了确保我们对模型的细节了如指掌, 我们将实现ReLU激活函数, 而不是直接调用内置的relu函数。

def relu(X):
    a = torch.zeros_like(X)
    return torch.max(X, a)

3. 模型

因为我们忽略了空间结构, 所以我们使用reshape将每个二维图像转换为一个长度为num_inputs的向量。 只需几行代码就可以实现我们的模型。

def net(X):
    X = X.reshape((-1, num_inputs))
    H = relu(X@W1 + b1)  # 这里“@”代表矩阵乘法
    return (H@W2 + b2)

4. 损失函数

直接使用高级API中的内置函数来计算softmax和交叉熵损失。

loss = nn.CrossEntropyLoss(reduction='none')

5. 训练

多层感知机的训练过程与softmax回归的训练过程完全相同。 可以直接调用d2l包的train_ch3函数, 将迭代周期数设置为10,并将学习率设置为0.1.

num_epochs, lr = 10, 0.1
updater = torch.optim.SGD(params, lr=lr)
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, updater)

 6、预测

d2l.predict_ch3(net, test_iter)

 

您可能感兴趣的与本文相关的镜像

GPT-oss:20b

GPT-oss:20b

图文对话
Gpt-oss

GPT OSS 是OpenAI 推出的重量级开放模型,面向强推理、智能体任务以及多样化开发场景

<think> 我们参考动手学深度学习》的官方环境配置指南(https://zh-v2.d2l.ai/chapter_installation/index.html)整理从零配置环境的流程。以下是详细步骤: ### 一、安装Miniconda(Python环境管理) 1. **下载Miniconda** - 访问 [Miniconda官网](https://docs.conda.io/en/latest/miniconda.html),选择对应操作系统的安装包(Windows x64 / macOS Intel或Apple Silicon / Linux)[^1]。 - **Windows用户注意**:建议安装时取消勾选"Add Miniconda to PATH"(避免冲突),后续通过Anaconda Prompt使用conda命令[^1]。 2. **安装验证** 打开终端(Windows用Anaconda Prompt,macOS/Linux用Terminal)执行: ```bash conda --version # 应显示版本号如 conda 24.5.0 ``` ### 二、创建虚拟环境并激活 1. **创建环境**(命名为`d2l`,Python版本建议3.9): ```bash conda create --name d2l python=3.9 -y ``` 2. **激活环境**: ```bash conda activate d2l # Windows/macOS/Linux通用命令 ``` ### 三、安装深度学习框架和d2l库 1. **安装PyTorch CPU版**(以PyTorch 2.x为例)[^2] ```bash # Windows/Linux/macOS通用命令(无GPU) pip install torch==2.0.1 torchvision==0.15.2 ``` > **GPU用户**:根据CUDA版本选择安装命令,例如CUDA 11.8: > ```bash > pip install torch==2.0.1 torchvision==0.15.2 --index-url https://download.pytorch.org/whl/cu118 > ``` 2. **安装d2l库及其他依赖**: ```bash pip install d2l==1.0.3 matplotlib pandas jupyterlab ``` ### 四、验证安装 1. 启动Jupyter Notebook: ```bash jupyter notebook ``` 2. 新建Notebook,运行测试代码: ```python import torch from d2l import torch as d2l print(torch.__version__) print(d2l.__version__) x = torch.arange(4) print(x) ``` 预期输出: ``` 2.0.1 1.0.3 tensor([0, 1, 2, 3]) ``` --- ### 配置优化建议 1. **加速下载**:配置pip清华镜像源(临时使用): ```bash pip install -i https://pypi.tuna.tsinghua.edu.cn/simple 包名 ``` 2. **环境备份**: ```bash conda env export > environment.yml # 导出环境配置 ``` --- §§相关问题§§ 1. 如何在Windows系统中彻底卸载Miniconda? 2. 如何为PyTorch安装CUDA Toolkit以实现GPU加速? 3. 使用Jupyter Notebook时如何切换conda虚拟环境? 4. 如何解决安装过程中出现的库版本冲突问题? </think> 以下是动手学深度学习从零开始配置环境的详细流程,基于官方指南和实践验证整理: --- ### 一、安装Miniconda(Python环境管理) 1. **下载Miniconda** - 访问 [Miniconda官网](https://docs.conda.io/en/latest/miniconda.html) - 选择对应操作系统的安装包: - Windows:`Miniconda3-latest-Windows-x86_64.exe` - macOS:`Miniconda3-latest-MacOSX-x86_64.sh` (Intel) 或 `Miniconda3-latest-MacOSX-arm64.sh` (Apple Silicon) - Linux:`Miniconda3-latest-Linux-x86_64.sh` 2. **运行安装** - **Windows**:双击安装包,注意关键步骤: - 安装路径建议改为非C盘(如 `D:\Miniconda3`)[^1] - 勾选 **"Add Miniconda3 to my PATH environment variable"**(否则需通过Anaconda Prompt使用) - **macOS/Linux**: ```bash bash Miniconda3-latest-*.sh # 执行安装脚本 ``` 3. **验证安装** ```bash conda --version # 应显示版本号如 conda 24.5.0 ``` --- ### 二、创建虚拟环境 1. **创建名为`d2l`的环境**(Python 3.9) ```bash conda create --name d2l python=3.9 -y ``` 2. **激活环境** ```bash conda activate d2l # Windows/macOS/Linux通用 ``` --- ### 三、安装核心依赖库 ```bash # 安装PyTorch CPU版本(无GPU) pip install torch==2.0.1 torchvision==0.15.2 # 安装d2l库及科学计算套件 pip install d2l==1.0.3 matplotlib pandas jupyterlab # 国内用户建议使用清华源加速 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple 包名 ``` > **GPU用户补充**:安装CUDA版PyTorch(需提前安装NVIDIA驱动) > ```bash > pip install torch==2.0.1 torchvision==0.15.2 --index-url https://download.pytorch.org/whl/cu118 > ``` --- ### 四、验证环境 1. 启动Jupyter Notebook: ```bash jupyter notebook ``` 2. 新建Notebook执行测试代码: ```python import torch from d2l import torch as d2l print(torch.__version__) # 应输出 2.0.1 print(d2l.__version__) # 应输出 1.0.3 x = torch.arange(4) # 应输出 tensor([0, 1, 2, 3]) ``` --- ### 五、配置优化建议 1. **永久换源加速**: ```bash # 配置conda清华源 conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ conda config --set show_channel_urls yes # 配置pip阿里源 pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/ ``` 2. **清理磁盘空间**: ```bash conda clean --all # 删除缓存包 pip cache purge # 清理pip缓存 ``` --- ### 环境总占用估算 | 组件 | 磁盘占用 | |------------------|----------| | Miniconda基础 | 400 MB | | PyTorch CPU | 800 MB | | d2l+依赖库 | 200 MB | | 环境元数据 | 150 MB | | **总计** | **≈1.5GB** | ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值