激活函数到底是在干什么？

最新推荐文章于 2025-03-23 19:27:56 发布

courniche

最新推荐文章于 2025-03-23 19:27:56 发布

阅读量822

点赞数 9

文章标签：机器学习

本文链接：https://blog.youkuaiyun.com/courniche/article/details/144880616

版权

激活函数是神经网络中的一个核心组件，主要作用是引入非线性能力，使得网络能够学习和表示复杂的模式和非线性关系。如果没有激活函数，神经网络的每一层只能表示线性变换，无法解决实际中的复杂问题。

一、激活函数的主要作用

情景模拟：灯光调节系统

想象一个房间里的灯光调节系统，它的亮度控制器就像神经网络中的激活函数。

没有激活函数（线性控制器）：
- 你转动控制旋钮，灯光亮度和旋钮的角度成线性关系（例如，旋转角度 θ\thetaθ，灯光亮度 L∝θL \propto \thetaL∝θ）。
- 问题是，这样的灯光调节系统无法处理复杂的需求，比如“根据房间内的时间、温度、和人数，自动调整灯光到合适的亮度”。
有激活函数（非线性控制器）：
- 激活函数类似于添加了一些“逻辑”到控制器中，比如：
  - 如果房间有人且时间为晚上，自动将亮度调到70%；
  - 如果房间空无一人，将亮度降到5%；
  - 如果有人进来，逐渐提升亮度到60%。
- 这种非线性反应使灯光调节变得更智能，能应对更多样化的场景。

对应到神经网络

Sigmoid函数：类似于一个温和的开关，输入的变化会逐渐影响输出，但输出范围固定在0到1之间。
比如，你把灯的旋钮转到一半时，灯光逐渐变亮但不会超过100%。
ReLU（Rectified Linear Unit）：像一个截断器，负值时输出为0，正值时与输入成线性关系。
比如，灯的亮度不能是负值，旋钮转动方向错误时灯光保持关闭。
Tanh函数：输出范围是-1到1，适用于需要有正负变化的场景。
比如，灯光不仅可以调节亮度，还可以调节颜色的冷暖（正值代表暖色，负值代表冷色）。