常见激活函数
阶跃型函数
s g n sgn sgn函数
s g n sgn sgn函数定义为:
s g n ( x ) = { 1 , x ≥ 0 ; 0 , x < 0. sgn(x) = \begin{cases} 1, & x \geq 0; \\ 0, & x< 0. \end{cases} sgn(x)={
1,0,x≥0;x<0.
s g n ( x ) sgn(x) sgn(x)通过将输入转换为输出值 0 0 0和 1 1 1,来表示神经元的抑制( 0 0 0)和兴奋( 1 1 1)。
然而,由于 s g n ( x ) sgn(x) sgn(x)具有不连续、不光滑等不太好的性质,因此实际常用 S i g m o i d Sigmoid Sigmoid型函数做为激活函数。
S i g m o i d Sigmoid Sigmoid型函数
S i g m o i d Sigmoid Sigmoid型函数是指一类 S S S型曲线函数,为两端饱和函数。常用的 S i g m o i d Sigmoid Sigmoid型函数有 L o g i s t i c Logistic Logistic函数和 T a n h Tanh Tanh函数。
饱和
对于函数 f ( x ) f(x) f(x),若 x → − ∞ x \rightarrow -\infty x→−∞时,其导数 f ′ ( x ) → 0 f^\prime(x) \rightarrow 0 f′(x)→0,则称其为左饱和。
若 x → + ∞ x \rightarrow +\infty x→+∞时,其导数 f ′ ( x ) → 0 f^\prime(x) \rightarrow 0 f′(x)→0,则称其为右饱和。
当同时满足左、右饱和时,就称为两端饱和。
L o g i s t i c Logistic Logistic函数
L o g i s t i c Logistic Logistic函数定义为:
σ ( x ) = 1 1 + e − x \sigma(x) = \frac{1}{1+e^{-x}} σ(x)=1+e−x1
L o g i s t i c Logistic Logistic函数将输入映射为区间 ( 0 , 1 ) (0,1) (0,1)之间的输出值,当输入值在 0 0 0附近时, S i g m o i d Sigmoid Sigmoid型函数近似为线性函数;当输入值靠近两端时,对输入进行抑制。输入越小,越接近于0;输入越大,越接近于1。这样的特点也和生物神经元类似,对一些输入会产生兴奋(输出为1),对另一些输入产生抑制(输出为0)。和感知器使用的阶跃激活函数相比, L o g i s t i c Logistic Logistic函数是连续可导的,其数学性质更好。
函数图如下:
T a n h Tanh Tanh函数
T a n h Tanh Tanh函数定义为:
t a n h ( x ) = e x − e − x e x + e − x tanh(x)=\frac{e^x-e^{-x}}{e^x+e^{-x}} tanh(x)=ex+e−xex−e−x
T a n h ( x ) Tanh(x) Tanh(x)函数将输入映射为区间 ( − 1 , 1 ) (-1,1) (−1,1)上的输出值,可以看作是放大并平移的 L o g i s t i c Logistic Logistic函数:
t a n h ( x ) = 2 σ ( 2 x ) − 1 tanh(x)=2\sigma(2x)-1 tanh(x)=2σ(2x)−1
函数图如下:
T a n h Tanh Tanh函数的输出是零中心化的(Zero-Centered),而 L o g i s t i c Logistic Logistic函数的输出恒大于0. 非零中心化的输出会使得其后一层的神经元的输入发生偏置偏移(Bias Shift),并进一步使得梯度下降的收敛速度变慢。
H a r d − L o g i s t i c Hard-Logistic Hard−Logistic函数和 H a r d − T a n h Hard-Tanh Hard−Tanh函数
L o g i s t i c Logistic Logistic函数和 T a n h Tanh Tanh函数都是 S i g m o i d Sigmoid Sigmoid型函数,具有饱和性,但是计算开销较大。因为这两个函数都是在中间(0 附近)近似线性,两端饱和。因此,这两个函数可以通过分段函数来近似。
H a r d − L o g i s t i c Hard-Logistic Hard−Logistic函数
以 L o g i s t i c Logistic Logistic函数为例,其导数为 σ ′ ( x ) = σ ( x ) ( 1 − σ ( x ) ) \sigma^\prime(x)=\sigma(x)(1-\sigma(x)) σ′(x)=σ(x)(1−σ(x))。 L o g i s t i c Logistic Logistic函数在 0 0 0附近的一阶泰勒展开(Taylor expansion) 为:
g l ( x ) ≈ σ (