【DL经典回顾】激活函数大汇总(三)(Swish & GELU附代码和详细公式)

本文详细介绍了Swish和GELU两种激活函数,包括它们的数学定义、函数特性、导数、使用场景及局限性,并提供了Python代码实现。Swish通过自门控机制提高模型性能,而GELU则引入输入的随机正则化,适用于自然语言处理等领域。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

激活函数大汇总(三)(Swish & GELU附代码和详细公式)

更多激活函数见激活函数大汇总列表

一、引言

欢迎来到我们深入探索神经网络核心组成部分——激活函数的系列博客。在人工智能的世界里,激活函数扮演着不可或缺的角色,它们决定着神经元的输出,并且影响着网络的学习能力与表现力。鉴于激活函数的重要性和多样性,我们将通过几篇文章的形式,本篇详细介绍两种激活函数,旨在帮助读者深入了解各种激活函数的特点、应用场景及其对模型性能的影响。

在接下来的文章中,我们将逐一探讨各种激活函数,从经典到最新的研究成果。

限于笔者水平,对于本博客存在的纰漏和错误,欢迎大家留言指正,我将不断更新。

二、Swish

Swish激活函数是由Google Brain团队在2017年提出的,旨在提高深度学习模型在各种任务上的性能。Swish函数是通过自门控机制(即输入和输出之间的相互作用)来增强模型的表达能力,从而解决了传统激活函数,如ReLU,可能面临的一

Swish激活函数是一种非饱激活函数,它在深度学习中被广泛使用。Swish函数的定义为f(x) = x * sigmoid(x),其中sigmoid(x)是Sigmoid函数。Swish函数的特点是在输入值较时,它的导数仍然保持较的值,这有助于减轻梯度消失的问题。相比于Sigmoidtanh等饱激活函数Swish函数在一些任务上表现更好。\[1\]你可以参考\[2\]中的博客文章了解更多关于Swish激活函数的绘制使用方法。 #### 引用[.reference_title] - *1* *2* [深度学习—激活函数详解(Sigmoid、tanh、ReLU、ReLU6及变体P-R-Leaky、ELU、SELU、Swish、Mish、Maxout、...](https://blog.youkuaiyun.com/jsk_learner/article/details/102822001)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [【Pytorch神经网络理论篇】 07 激活函数+Sigmoid+tanh+ReLU+Swish+Mish+GELU](https://blog.youkuaiyun.com/qq_39237205/article/details/123258462)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

夺命猪头

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值