激活函数Elu、Gelu、Swish、Silu、Sigmoid

taoqick

已于 2024-09-06 13:49:16 修改

阅读量1k

点赞数

CC 4.0 BY-SA版权

文章标签： python 开发语言

于 2023-04-16 20:16:53 首次发布

原文链接：https://pytorch.org/docs/stable/generated/torch.nn.GELU.html

文章探讨了三种不同的激活函数在神经网络中的应用，包括ReLU的线性特性，GELU的高斯误差线性单元，以及Swish函数（又称Silu），并提供了PyTorch库中对GELU的实现链接，强调了这些函数对模型性能的影响。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

先来张效果对比图：
在这里插入图片描述

Sigmoid

不过（0,0）点：
在这里插入图片描述

ELU（Exponential Linear Unit）

在这里插入图片描述

RELU (Rectified Linear Unit)

在这里插入图片描述

GELU(Gaussian Error Linear Units)

在这里插入图片描述

Swish 激活函数也叫Silu

在这里插入图片描述
转载自：

https://mp.weixin.qq.com/s/BY5_NKrSOMQ0o4GxWUeYKA
https://pytorch.org/docs/stable/generated/torch.nn.GELU.html
https://blog.youkuaiyun.com/renwudao24/article/details/44465407

博客等级

码龄13年

478
原创

1345
点赞

2708
收藏

655
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 关于“知识蒸馏“，你想知道的都在这里！

下一篇：: FGSM网络对抗攻击

最新评论

图片视频抹除算法总结Inpaint
优快云-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性。
分析transformer模型的参数量、计算量、中间激活、KV cache、bf16、fp16、混合精度训练
优快云-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
LeetCode 1032. Stream of Characters 4行Trie树
优快云-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)提升标题与正文的相关性；(3)增加条理清晰的目录。
旋转式位置编码Rotary Position Embedding（RoPE）
优快云-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性。
量化QAT QLoRA OBD OBS GPTQ
优快云-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性。

大家在看

最新文章

2025

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。