李沐动手学深度学习第4章-4.1多层感知机

原创

已于 2022-09-05 16:16:01 修改 · 641 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #人工智能

于 2022-09-05 16:14:59 首次发布

本文介绍了多层感知机如何通过隐藏层增强模型能力，重点讨论了ReLU、sigmoid和tanh三种常见的激活函数，包括它们的定义、曲线展示和导数特性。理解这些概念有助于设计更有效的神经网络模型。

在colab中运行本节内容需先安装d2l

!pip install d2l==0.14.

1、隐藏层

我们可以通过在网络中加入一个或多个隐藏层来克服线性模型的限制，使其能处理更普遍的函数关系类型。

多层感知机可以通过隐藏神经元，捕捉到输入之间复杂的相互作用，这些神经元依赖于每个输入的值。

虽然一个单隐层网络能学习任何函数，但并不意味着我们应该尝试使用单隐藏层网络来解决所有问题。事实上，通过使用更深（而不是更广）的网络，我们可以更容易地逼近许多函数。

2. 激活函数

通过计算加权和并加上偏置来确定神经元是否应该被激活，它们将输入信号转换为输出的可微运算。大多数激活函数都是非线性的。

导入需要的包：

%matplotlib inline
import torch
from d2l import torch as d2l

2.1. ReLU函数

最受欢迎的激活函数是修正线性单元（Rectified linear unit，ReLU）

RELU（x）=max（x,0）

通俗地说，ReLU函数通过将相应的活性值设为0，仅保留正元素并丢弃所有负元素。为了直观感受一下，我们可以画出函数的曲线图。正如从图中所看到，激活函数是分段线性的。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

nousefully

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【动手学深度学习】李沐——多层感知机

FavoriteStar的博客

10-15

1482

【动手学深度学习】李沐——多层感知机章节的学习记录，包括代码的解释及个人见解。

李沐动手学深度学习-学习笔记之多层感知机

weixin_47970060的博客

12-24

1213

单层感知机→多层感知机：同或门的引用关于隐藏层的理解这篇文章解释的很好，本小白表示看懂了神经网络的隐藏层https://blog.csdn.net/weixin_41066584/article/details/90581842

参与评论您还未登录，请先登录后发表或查看评论

李沐 多层感知机 + 代码实现

Asv1p的博客

10-16

721

感知机：二分类模型，无法处理XOR函数训练感知机：初始化w=0，b=0 Repeat： If yi*[<w,xi>+b]<=0 then W <- w+yi*xi and b<-b+yi End if 直到所有的类分类正确等价于批量大小为1的梯度下降 多层感知机：单隐藏层-----单分类 h=σ(w1x+b1w_1x+b_1w1x+b1) o=w2Th+b2w^T_2h+b_2w2Th+b2 隐藏层不能使用线性激活函数，需要激活函数σ，按元素做运算激活

李沐《动手学深度学习》多层感知机 模型概念和代码实现

weixin_47748259的博客

01-19

1738

隐藏层数目和隐藏单元数视为超参数，一般选择2的若干次幂为层的宽度，因为内存在硬件中的分配和寻址方式，这么做往往可以在计算上更高效。当输入为0时，sigmoid函数的导数达到最大值0.25，输入在任一方向越远离0点时，导数越接近0。导入相关库，设置批量大小为256，调用load_data_fashion_mnist函数获取数据集。当输入接近0时，tanh函数的导数接近最大值1，输入在任一方向越远离0点时，导数越接近0。多层感知机架构：将许多全连接层堆叠在一起，每一层都输出到上面的层，直到生成最后的输出。

《李沐：动手学深度学习v2 pytorch版》第4章：4.1-4.3多层感知机

weixin_44219441的博客

04-14

1169

nn.ReLU(),

李沐《动手学深度学习》 | 4.1-4.3 多层感知机

好好学习天天向上

05-09

1121

损失函数(单样本)为。

李沐深度学习第四章多层感知机总结

07-26

### 李沐深度学习第四章多层感知机总结 #### 一、感知机与多层感知机基础 **1.1 感知机简介** 感知机是一种基本的线性分类器，它试图通过找到一个超平面来划分不同类别的样本。在二分类问题中，感知机的目标是...

【Dive into Deep Learning |动手学深度学习（李沐）】4.1 多层感知机--学习笔记

weixin_49191101的博客

07-10

567

可以将这两条线看作xy轴，首先对于蓝色的这条线，若x<0,划为正类，如下图1、3小球为‘+’，2、4小球为‘-’；这段伪代码的意思是：首先初始化参数，w、b为0，repeat即开始一个循环，从i到n(n表示有多少个样本），判断yi与y_hat是都同号，即y_hat=<w,xi>+b。输入x是n维的，假设设定的隐藏层个数为m，则参数w1的维度为[m,n],b1为偏移，维度为[m,1]是线性的，则最后得到的结果也还是一个线性模型，相当于还是一个单层感知机，所以激活函数不能是线性的。唯一多了的就是一层隐藏层。

个人学习笔记3：动手学深度学习pytorch版-李沐

浪子L的博客

09-03

1873

主要记录学习笔记，学习书目为李沐老师的《动手学习深度学习》重预备知识开始记录。开源书籍地址：https://zh-v2.d2l.ai/chapter_preface/index.htmll 李沐老师B站视频：https://space.bilibili.com/1567748478/channel/seriesdetail?sid=358497

动手学深度学习（李沐）PyTorch 第 4 章 多层感知机

m0_51448653的博客

09-28

1638

实现这一惩罚最方便的方法是对所有项求平方后并将它们求和。参数：w：通常是神经网络的权重向量（或矩阵），也可以是任何需要正则化的参数。w 是一个 torch.Tensor 对象，它可以是模型中的权重张量。w.pow(2)：w.pow(2) 表示对张量 w 中的每个元素进行平方运算。实际上，这等价于对张量 w 中每个权重求平方：w^2=w x w这个操作是逐元素的，生成一个新的张量，其元素是原来w中每个元素的平方。是对w.pow(2)结果的所有元素进行求和。这个操作会返回一个标量。

动手学深度学习_4

01-06

动手学深度学习_41循环神经网络1.1 GRU1.2 LSTM1.3 深层RNN深度循环神经网络1.4 双向RNN双向循环神经网络2 机器翻译3 注意力机制与Seq2seq模型3.1注意力机制3.2 注意力机制框架3.3 点积注意力3.4 引入注意力机制的Seq2seq模型4 Transformer4.1多头注意力层4.2 位置编码4.3 解码器 1循环神经网络 1.1 GRU RNN存在的问题：梯度较容易出现衰减或爆炸（BPTT） Ht=ϕ(XtWxh+Ht−1Whh+bh) H_{t} = ϕ(X_{t}W_{xh} + H_{t-1}W_{hh} + b_{h}) Ht=ϕ(Xt

李沐-动手学深度学习-多层感知机的实现

qq_60678226的博客

06-06

775

简单介绍了多层感知机的原理，及各个层之间的对应关系，多层感知机的代码实现。

李沐深度学习-多层感知机、模型选择、过拟合、欠拟合

2302_80719643的博客

09-25

1350

和softmax回归唯一的不同在于，添加了2个全连接层。第一层是[隐藏层]，它(包含256个隐藏单元，并使用了ReLU激活函数第二层是输出层。nn.ReLU(),实现一个函数来评估模型在给定数据集上的损失"""评估给定数据集上模型的损失"""metric = d2l.Accumulator(2) # 损失的总和,样本数量定义训练函数# 不设置偏置，因为我们已经在多项式中实现了它。

跟李沐学AI：多层感知机

Landy_Jay的博客

07-16

1003

感知机是一个二分类模型，是最早的AI模型之一它的求解算法等价于使用批量大小为1的梯度下降它不能拟合Xor函数，导致第一次AI寒冬多层感知机在输出层和输入层之间增加一个或多个全连接隐藏层，并通过激活函数转换隐藏层的输出。常用的激活函数包括ReLU函数、sigmoid函数和tanh函数。使用Softmax来处理多类分类超参数为隐藏层数和各个隐藏层大小W_1b_1b_2%5Csigmab_1%29b_2。

跟李沐老师动手学习AI学习笔记：第四章——多层感知机

AndrewPerfect的博客

06-29

451

选择非线性的激活函数的目的：如果是线性函数，则得到的output和input还是线性的关系，所以不能用线性激活函数]

李沐动手深度学习（pycharm中运行笔记）——10.多层感知机+从零实现+简介实现

qq_54556560的博客

05-26

1712

本文系统介绍了感知机与多层感知机的原理与实现。感知机作为最早的二分类AI模型，通过权重计算和激活函数输出分类结果，但无法解决XOR等非线性问题。多层感知机通过引入隐藏层和非线性激活函数（如ReLU）克服了这一限制。文章详细展示了从零实现和简洁实现两种方法：前者手动构建网络结构、初始化参数并实现ReLU函数；后者利用PyTorch高级API快速搭建模型。两种方法均在Fashion-MNIST数据集上完成训练评估，验证了多层感知机处理复杂分类任务的能力。关键点包括隐藏层大小设置、激活函数选择及超参数优化。

李沐动手学深度学习第四章-4.4模型选择、欠拟合和过拟合

nousefully的博客

09-05

1028

无

Dive into deep learning(04)[动手学深度学习]———————第四章 深度学习计算

weixin_52542715的博客

10-10

863

Dive into deep learning(04)[动手学深度学习]———————第四章 深度学习计算

李沐-感知机

qq_36136196的博客

07-07

247

单层感知机感知机的原理说明：https://www.cnblogs.com/turingbrain/p/7355265.html 训练感知机收敛定理感知机的问题不能你和XOR问题，它只能产生线性分割面总结 多层感知机 两层感知机，处理XOR问题线性激活函数f(x)=x 非线性的激活函数 sigmoid:(0,1) tanh：(-1,1) relu函数：max(0,x)，常用，原因简单，没有指数多隐藏层：最后一层不需要激活函数，因为激活函数是为了防止层数的塌陷，输出的话是不用的

李沐动手学深度学习 v2-pytorch