【动手学深度学习】多层感知机（MLP）

最新推荐文章于 2025-03-18 14:42:05 发布

Ya_nnnG

最新推荐文章于 2025-03-18 14:42:05 发布

阅读量2.1k

点赞数 9

分类专栏：深度学习文章标签：深度学习

本文链接：https://blog.youkuaiyun.com/Ya_nnnG/article/details/128697219

版权

1 多层感知机的从零开始实现

torch.nn

继续使用Fashion-MNIST图像分类数据集

导入需要的包

import torch
from torch import nn
from d2l import torch as d2l

batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)  ##获取迭代器

1.1 初始化模型参数

nn.Parameter()

为什么要乘0.01？

多层感知机中的超参数：隐藏层个数，每个隐藏层的隐藏单元个数（通常为2的若干次幂）

num_inputs, num_outputs, num_hiddens = 784, 10, 256
# num_hiddens为单隐藏层中隐藏单元的个数
W1 = nn.Parameter(torch.randn( num_inputs, num_hiddens, requires_grad=True) * 0.01)
b1 = nn.Parameter(torch.zeros(num_hiddens, requires_grad=True))
W2 = nn.Parameter(torch.randn(num_hiddens, num_outputs, requires_grad=True) * 0.01)
b2 = nn.Parameter(torch.zeros(num_outputs, requires_grad=True))

params = [W1, b1, W2, b2]

1.2 激活函数

为了进一步了解实现的细节，我们在这里自己定义一个ReLU激活函数，而不是直接调用内置relu函数

def relu(X):
    a = torch.zeros_like(X)
    return torch.max(X, a)   # 返回0和X中的最大值

1.3 模型

代表矩阵乘法运算，相当于torch.mul()

def net(X):
    X = X.reshape((-1, num_inputs))
    H = relu(X@W1 + b1)  # 这里“@”代表矩阵乘法
    return (H@W2

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Ya_nnnG

关注关注

9
点赞
踩
13

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

多层感知机（Multilayer Perceptron，MLP）超参数的选择以及过拟合问题解决方法

KdpdCode的博客

09-23

1694

(1) 隐藏层数量和每个隐藏层的神经元数量：隐藏层数量和每层的神经元数量严重影响了模型的表示能力和复杂性。通过随机断开神经元之间的连接，Dropout可以减轻神经元之间的依赖关系，从而降低模型过拟合的风险。通过合理选择超参数，使用正则化方法和增加训练数据等策略，可以有效解决MLP模型的过拟合问题，并提高模型的泛化能力。(1) 数据扩增（Data Augmentation）：通过对训练数据进行随机变换，如旋转、平移、缩放和翻转等，可以增加数据的多样性，降低模型过拟合的风险。解决MLP模型过拟合问题的方法。

多层感知器（MLP）

m0_51200050的博客

06-30

3384

多层感知器（MLP）是一种前馈神经网络，通过多层线性变换和非线性激活函数，能够建模复杂的非线性关系。MLP 在各种任务中广泛应用，如分类、回归和序列预测等。通过前向传播、损失计算和反向传播的步骤，MLP 能够逐步调整参数，优化模型性能。具体数据示例帮助理解 MLP 的工作原理和实现过程。

1 条评论您还未登录，请先登录后发表或查看评论

深入理解多层感知机（MLP）：原理与代码解析

weixin_43749805的博客

06-14

2万+

多层感知机（MLP）是一种经典的神经网络模型，由多个神经元层组成。它的结构和功能使其成为深度学习中的重要组成部分。MLP在各种任务中表现出色，如图像分类、文本分类、预测和回归等。

多层感知机

最新发布

yxx122345的博客

03-18

846

感知机（Perceptron）是神经网络的基本单元，由 Frank Rosenblatt 在 1957 年提出。它是一个二分类模型，输入为特征向量，输出为类别标签（如 0 或 1）。yfw⋅xbyfw⋅xb其中：xxx是输入特征向量，www是权重向量，bbb是偏置项，fff是激活函数（如阶跃函数）。

小白笔记：对MLP多层感知机概念、结构、超参数的理解

m0_73798143的博客

03-12

2万+

一起了解多层感知机MLP的概念、结构和关键超参数吧！

深度学习之MLP层

weixin_69464301的博客

06-20

476

`self.fc2 = nn.Linear(hidden_dim1, hidden_dim2)`：定义第二个全连接层，将维度从 `hidden_dim1` 转换为 `hidden_dim2`。- `self.fc3 = nn.Linear(hidden_dim2, output_dim)`：定义输出层，将维度从 `hidden_dim2` 转换为 `output_dim`。- 隐藏层：两个隐藏层，大小分别为 `hidden_dim1` 和 `hidden_dim2`

MLP是多层感知机（Multi-Layer Perceptron）

m0_51200050的博客

07-14

2103

在Transformer模型中，MLP块用于在自注意力机制之后进一步处理信息。它通过两个线性变换和一个非线性激活函数实现对输入向量的非线性变换和处理，从而增强模型的表达能力。通过这种结构，Transformer能够在捕捉序列中不同位置之间的依赖关系的同时，有效处理和表示复杂的输入数据。

【深度学习】多层感知机（MLP）

九筠的博客

11-15

6408

多层感知机（Multilayer Perceptron，简称MLP）是一种前向人工神经网络模型，由多个神经元组成的网络层间以全连接的方式连接。MLP由若干个神经元组成的多个层次组成，其中包括输入层、隐藏层和输出层。输入层接收输入数据，并将数据传递给隐藏层。隐藏层通过激活函数将输入值转换为输出值，并将其传递到输出层。输出层给出最终的预测结果。每个神经元在隐藏层和输出层中都有权重和偏置，可以看作一个非线性的函数，它接收来自上一层神经元的输入，并根据权重和偏置进行一系列的计算，最终产生输出。

多层感知机 MLP

一般路过底层打工人的博客

10-16

1821

介绍多层感知机以及响应代码

MATLAB实现MLP多层感知机时间序列预测（完整源码和数据）

10-21

标题中的“MATLAB实现MLP多层感知机时间序列预测”指的是使用MATLAB编程语言，通过多层感知机（Multilayer Perceptron, MLP）神经网络模型对时间序列数据进行预测的一种方法。多层感知机是一种前馈神经网络，具有...

【深度学习】常见模型-多层感知机（MLP，Multilayer Perceptron）

IT古董

01-21

1007

多层感知机（MLP）是一种经典的人工神经网络结构，由输入层、一个或多个隐藏层以及输出层组成。每一层中的神经元与前一层的所有神经元全连接，且各层间的权重是可学习的。MLP 是深度学习的基础模型之一，主要用于处理结构化数据、分类任务和回归任务等。

多层感知机（MLP）——深度学习

m0_73707009的博客

01-05

1500

多层感知机（Multilayer Perceptron，MLP）是人工神经网络的一种基础架构，是对传统感知机的扩展与深化。它由输入层、一个或多个隐藏层以及输出层构成。多层感知机的强大之处在于其能够通过大量的数据进行训练，自动调整各层之间的连接权重，进而对复杂的非线性关系进行建模和拟合，在分类、回归、预测等众多机器学习任务中都有着广泛的应用。

简单多层感知机（MLP)–pyTorch实现

01-06

多层感知机（MLP，Multilayer Perceptron）也叫人工神经网络（ANN，Artificial Neural Network），除了输入输出层，它中间可以有多个隐层，最简单的MLP只含一个隐层，即三层的结构，如下图最简单的MLP：上图模型pyTorch代码： import torch from torch.nn import functional as F x = torch.randn(1, 10) # 输入x的特征有10个 w = torch.randn(3, 10, requires_grad=True) # 一个隐藏层，节点个数为3 b = torch.rand

深度学习02-神经网络(MLP多层感知器)

热门推荐

liaomin416100569的专栏

05-09

8万+

神经网络是一种基于生物神经系统结构和功能特点而设计的人工神经网络模型，具有很强的自适应性和非线性映射能力。神经网络由多个神经元（或称节点）组成，这些神经元通过连接权重相互连接，构成多层的网络结构。每个神经元接收到来自其它神经元的信号，并将这些信号加权线性组合后通过激活函数进行非线性转换，最终输出给下一层神经元或输出层。学习机器学习后，学习神经网络可以帮助你更深入地理解模式识别和人工智能领域的基础知识。神经网络在很多领域都有广泛的应用，例如计算机视觉、自然语言处理、语音识别等。

入门：多层感知器Multiple-Layer Perceiver, MLP

m0_62110645的博客

04-13

2674

多层感知器（MLP）是一种具有较强非线性学习能力的人工神经网络，广泛应用于分类、回归和自然语言处理等领域。本文从MLP的基本概念、工作原理、激活函数、训练方法、应用领域、优缺点以及发展趋势等方面进行了简单的介绍。MLP的基本概念涉及了其作为人工神经网络的基本形式，包括输入层、隐藏层和输出层的结构。这种网络通过权重和偏置连接每层节点，并使用激活函数进行非线性变换。MLP的工作原理主要通过前向传播和反向传播两个步骤来实现。在前向传播中，数据从输入层经过隐藏层和输出层的处理，产生最终结果。

【机器学习】多层感知机如何调超参数

Everyday try to become better -Kobe Bryant

07-19

2111

我们知道，感知机（没有隐藏层）可以处理线性可分的数据（4.1有解释，不用管记住就行），因此除非你已经知道你的数据不是线性可分的，就用感知机就行。所以，验证数据的线性可分性这一点并没有坏处，因为我们没有必要使用比任务要求更加复杂的模型（多层感知机）来解决简单技术（感知机）就能够解决的线性可分问题。来自MLP的学术文献和个人的经验等，我们收集并经常依赖于一些经验法则(RoTrulesofthumb)，也发现它们是可靠的指南（这些指导往往是准确的，即使不准确也能够告诉我们每一步应该干什么）......

MLP:多层感知器Multi-layer Perceptron

weixin_49825058的博客

03-17

1338

MLP是多层感知器（Multilayer Perceptron）的缩写，是一种基本的人工神经网络（Artificial Neural Network，ANN）模型，是一种前馈神经网络。它是由多个神经元组成的网络，通常包含一个或多个隐藏层（hidden layers）、一个输入层（input layer）和一个输出层（output layer）。

pytorch李沐动手学深度学习（二.MLP和NN）

weixin_49007132的博客

04-13

1998

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、线性神经网络读取数据集定义模型块训练二、线性回归的简洁实现三、图像分类数据集d2l相关库读取图像sofemax多层感知机DropoutDropout（简洁）一、线性神经网络读取数据集 def data_iter(batch_size, features, labels): num_examples = len(features) indices = list(range(num_examples)) .

多层感知机（MLP）算法原理和代码实现

taozibaby的博客

07-10

2908

多层感知机（MLP）算法原理和代码实现

mlp多层感知机与深度学习

09-03