深度学习——ReLU激活函数的用法和作用

原创已于 2023-11-07 13:36:31 修改 · 6.2k 阅读

19 ·

CC 4.0 BY-SA版权

文章标签：

#python

于 2023-09-19 09:28:57 首次发布

本文介绍了ReLU激活函数的定义、在PyTorch中的使用（包括inplace选项），以及如何在AlexNet网络中应用，重点强调了其增强非线性特性和内存优化的作用。

部署运行你感兴趣的模型镜像

一、ReLU激活函数的介绍

ReLU函数的定义如下：对于输入x，如果x大于等于0，则输出为x本身；如果x小于0，则输出为0。可以表示为 ReLU(x) = max(0, x)。

二、ReLU激活函数的的作用

torch.nn.ReLU(inplace=True)是PyTorch中的一个激活函数，其功能是对输入进行逐元素的非线性变换。

当参数inplace=True表示将变换后的结果直接覆盖原来的输入张量，节省内存空间。如果没有指定inplace=True，则会返回一个新的张量作为输出。

通过应用torch.nn.ReLU(inplace=True)，可以实现将负值部分截断为0的操作，从而增强神经网络的非线性特性，并且可以帮助网络更好地学习特征。

三、ReLU激活函数的举例用法

AlexNet网络结构中的第一层卷积为例：

其输入的图像大小为：227x227x3的图像

filter:11x11x48,stride=4,padding=0
output_size=(input_size+2xpadding-kernel_size)/stride+1=(227+2x0-11)/4+1=55
输出：55x55x48
激活函数：ReLU

您可能感兴趣的与本文相关的镜像

ACE-Step

音乐合成

ACE-Step

ACE-Step是由中国团队阶跃星辰（StepFun）与ACE Studio联手打造的开源音乐生成模型。它拥有3.5B参数量，支持快速高质量生成、强可控性和易于拓展的特点。最厉害的是，它可以生成多种语言的歌曲，包括但不限于中文、英文、日文等19种语言

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

o涂鸦小巷的菇凉o

关注关注

2
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Keras深度学习实战——深度学习中常用激活函数和损失函数详解

走向CTO的路上...

05-22

1577

本教程将介绍 Keras 深度学习框架中常用的激活函数和损失函数。激活函数用于引入非线性特性，使得神经网络能够更好地学习和模拟复杂的输入输出关系；损失函数用于度量模型预测结果与真实值之间的差异，选择合适的损失函数对于模型的训练至关重要。Keras 深度学习框架提供了简单易用的工具来选择和使用激活函数和损失函数，这使得深度学习技术可以更加广泛地应用。

1. 深度学习——激活函数

qq_32468785的博客

11-10

1484

激活函数是一种用于神经网络和其他机器学习模型中的非线性函数。它被应用于神经网络的每个神经元上，将输入信号进行转换，产生输出信号。激活函数的作用是引入非线性性质，使神经网络能够学习和表示更复杂的函数关系。在神经网络中，每个神经元接收来自上一层神经元的加权输入，然后通过激活函数对这个加权输入进行非线性变换，生成神经元的输出。这个输出被传递到下一层神经元作为输入。激活函数的主要作用有以下几点：引入非线性：激活函数能够将线性变换后的输入转换为非线性输出，使得神经网络具备非线性建模能力。

参与评论您还未登录，请先登录后发表或查看评论

深入理解ReLU函数（ReLU函数的可解释性）

最新发布

limenga102的专栏

11-14

1111

激活函数是神经网络中的核心组件，它决定了神经元是否应该被"激活"，即是否将输入信号传递到下一层。激活函数为神经网络引入了非线性特性，使其能够学习复杂模式。f(x) = {"""可学习参数的ReLU变种"""# 使用自定义LearnableReLU])# 测试自定义层print("输入:", test_input.numpy())print("输出:", output.numpy())print("可学习参数alpha:", layer.alpha.numpy())

神经网络：ReLU和线性层

悠眠小虫的博客

01-13

4534

本文主要对ReLU激活函数和线性层做了相关介绍，阐述了其使用方法及在神经网络中的作用，同时结合相关代码以帮助读者理解。

relu函数的作用

weixin_46516242的博客

03-15

6726

relu函数的作用

Relu函数作用

无奈的小心酸的博客

07-06

2万+

转自一个知乎问答；https://www.zhihu.com/question/29021768 1.为什么引入非线性激励函数？如果不适用激励函数，那么在这种情况下每一层的输出都是上层输入的线性函数，很容易验证，无论你神经网络有多少层，输出都是输入的线性组合，与没有隐藏层效果相当，这种情况就是最原始的感知机（perceptron）了正因为上面的原因，我们决定引入非线性函数作为激励

Keras深度学习实战（4）——深度学习中常用激活函数和损失函数详解

盼小辉丶的博客

04-27

1万+

使用激活函数可以实现网络的高度非线性，这对于建模输入和输出之间的复杂关系非常关键，只有加入了非线性激活函数之后，深度神经网络才具备了令人惊异的非线性映射学习能力。利用损失函数计算损失值，模型就可以通过反向传播去更新各个参数，通过降低真实值与预测值之间的损失，使得模型计算得到的预测值趋近于真实值，从而达到模型训练的目的。激活函数和损失函数是神经网络中十分重要的组件，本节介绍深度学习中常用的激活函数和损失函数。.........

pytorch方法测试——激活函数(ReLU)详解

12-23

在深度学习领域，激活函数是神经网络的重要组成部分，它们引入非线性，使得神经网络能够学习更复杂的模式。ReLU（Rectified Linear Unit）是最常用的激活函数之一，因其简单高效而在现代神经网络中广泛使用。本文将...

YOLOv5改进系列（13）——更换激活函数之SiLU，ReLU，ELU，Hardswish，Mish，Softplus，AconC系列等

路人贾的博客

07-04

6892

手把手教你学会YOLOv5改进系列之如何更换激活函数，内含SiLU，ReLU，ELU，Hardswish，Mish，Softplus，AconC系列等详细讲解及改进方法！

RELU激活函数作用

加油鸭

05-08

2万+

梯度消失现象：在某些神经网络中，从后向前看，前面层梯度越来越小，后面的层比前面的层学习速率高。梯度消失原因： sigmoid函数导数图像导数最大为0.25<1 权重初始值通常使用一个高斯分布所以|w|<1，所以 wjσ′(zj)<0.25 ,根据链式法则计算梯度越来越小。由于层数的增加，多个项相乘，势必就会导致不稳定的情况。 sigmoid激活函数的...

ReLu(Rectified Linear Units)激活函数

weixin_34167043的博客

04-24

2158

论文参考：Deep Sparse Rectifier Neural Networks (很有趣的一篇paper）起源：传统激活函数、脑神经元激活频率研究、稀疏激活性传统Sigmoid系激活函数 传统神经网络中最常用的两个激活函数，Sigmoid系（Logistic-Sigmoid、Tanh-Sigmoid）被视为神经网络的核心所在。从数学上来看，非线性的Sigmoid函数对中央区...

relu激活函数在神经网络中到底起到了什么作用？

qq_40962125的博客

02-03

3600

可以看出，图像的纹理形状细节等特征没有发生变化，只是感觉暗了一些，这就是rule所带来的影响，从数学的角度也可以很好的解释，最基本的rule函数其实就是if x>0 : output =x;else: x=0;神经网络中激活函数的最直接目的是给网络提供非线性，如果没有激活函数，那么网络的每一层计算都将保持着上一层的线性结果，这样重复下去永远都是线性组合。左边的是conv2d后的结果，右侧为经过relu层后的结果。第一层卷积后的特征（浅层的卷积提取的往往都是一些表面的特征，例如颜色，形状等一些基本的特征）

Relu的作用

KAMITA的博客

07-10

6万+

Relu激活

2301_76846375的博客

10-05

2134

是卷积神经网络（CNN）以及许多深度学习模型中最常用的激活函数之一。它的主要作用是引入非线性，使模型能够学习和表达更复杂的特征。以下是对ReLU激活函数的详细解释。

为什么引入ReLU激活函数

独钓寒江雪

08-21

3万+

https://blog.youkuaiyun.com/fredinators/article/details/79443386 ReLu是神经网络中的一个激活函数，其优于tanh和sigmoid函数。 1.为何引入非线性的激活函数？如果不用激活函数，在这种情况下每一层输出都是上层输入的线性函数。容易验证，无论神经网络有多少层，输出都是输入的线性组合，与没有隐藏层效果相当，这种情况就是最原始的感知机（...

一文掌握ReLU激活函数：深度学习中不可或缺的神器

码上飞扬的博客

07-09

6979

ReLU，全称为修正线性单元(Rectified Linear Unit)，在深度学习领域中，是一种非常普遍且重要的激活函数，在众多神经网络模型中广泛应用。ReLU激活函数的实现非常简单，其数学表达式为： [ \text{ReLU}(x) = \max(0, x) ] 这意味着如果输入x为正，ReLU函数的输出就是x本身；如果输入x为负或者为0，ReLU函数的输出就是0。简单来说，ReLU函数就是一个线性和非线性特征的融合。

ReLU的作用

qq_43281582的博客

04-18

2526

ReLU的作用

深度学习激活函数ReLU、Leaky ReLU与SiLU对比分析

激活函数是深度学习模型中的核心组成部分之一，其作用在于为神经网络引入非线性因素，使得网络能够拟合复杂的函数映射关系。在没有激活函数的情况下，无论神经网络有多少层，其整体仍然只能表示线性变换，无法解决非...