55、卷积神经网络：原理、架构与实践方法

最新推荐文章于 2025-08-23 16:05:33 发布

java5

最新推荐文章于 2025-08-23 16:05:33 发布

阅读量18

点赞数

CC 4.0 BY-SA版权

分类专栏：医学AI前沿：图像与干预文章标签：卷积神经网络 CNN 非线性激活函数

本文链接：https://blog.youkuaiyun.com/java5/article/details/151064879

医学AI前沿：图像与干预专栏收录该内容

100 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

卷积神经网络：原理、架构与实践方法

1. 非线性激活函数

在神经网络设计中，非线性激活函数至关重要。若没有非线性激活函数，神经网络只能计算输入的线性函数，这具有很大的局限性。而且，非线性激活函数的选择会对神经网络的训练速度产生重大影响。以下是几种常见的非线性激活函数：
- Sigmoid函数 ：其定义为 $\sigma(x) = \frac{1}{1 + e^{-x}}$，$x \in R$。对于所有的 $x \in R$，有 $\sigma(x) \in (0,1)$，并且 $\sigma$ 是单调递增的，$\lim_{x \to \infty}\sigma(x) = 1$，$\lim_{x \to -\infty}\sigma(x) = 0$。这使得Sigmoid函数适合用于生成范围在 $[0,1]$ 的输出，如概率或归一化图像。然而，$\lim_{x \to \infty}\sigma’(x) = \lim_{x \to -\infty}\sigma’(x) = 0$，这意味着当输入 $x$ 远离0时，神经元会饱和，$\sigma(x)$ 关于 $x$ 的梯度会接近0，导致后续优化困难。因此，Sigmoid函数很少用于卷积神经网络（CNN）的中间层。
- Tanh函数 ：定义为 $\tanh(x) = \frac{e^{x} - e^{-x}}{e^{x} + e^{-x}}$，$x \in R$。对于所有的 $x \in R$，$\tanh(x) \in (-1,1)$，且 $\tanh$ 单调递增，$\lim_{x \to \infty}\tanh(x) = 1$，$\lim_{x \to -\infty}\tan