深度学习中的 `tanh` 激活函数

最新推荐文章于 2025-02-24 11:01:27 发布

starry_wfs

最新推荐文章于 2025-02-24 11:01:27 发布

阅读量610

点赞数 9

文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_61668277/article/details/140777838

版权

深度学习中的 `tanh` 激活函数

在深度学习中，tanh（双曲正切）是一种常用的激活函数，通常用于神经网络的隐藏层。它的数学表达式为：

[ \text{tanh}(x) = \frac{e^x - e^{-x}}{ex + e^{-x}} ]

Tanh 的输出范围是 ([-1, 1])，这与 sigmoid 函数（输出范围为 ([0, 1])）不同。使用 tanh 有几个优点和缺点：

优点

中心对称：tanh 函数是中心对称的，即对于任何输入 (x)，都有 (\text{tanh}(-x) = -\text{tanh}(x))。这意味着激活值可以是负的，从而更好地处理数据的正负两方面。
缓解梯度消失问题：与 sigmoid 相比，tanh 在零点附近的梯度更大，有助于缓解梯度消失问题。

缺点

梯度消失：尽管比 sigmoid 好一些，但在极端值附近（即输入值很大或很小时），tanh 的梯度依然接近零，可能导致梯度消失问题。
计算复杂：与 ReLU（修正线性单元）相比，tanh 的计算更加复杂，因为它涉及指数计算。

使用场景

Tanh 函数常用于以下场景：

中间层激活函数：在循环神经网络（RNN）中常常使用 tanh 作为中间层的激活函数。
对称数据：当数据的分布是中心对称的（例如均值为零）时，tanh 可以更好地表达数据的特性。

在选择激活函数时，除了 tanh，还可以考虑 ReLU、Leaky ReLU、ELU 等。具体选择哪种激活函数，通常需要根据具体问题和数据进行实验。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。