TensorFlow学习记录：激活函数

最新推荐文章于 2024-03-14 16:04:11 发布

原创

最新推荐文章于 2024-03-14 16:04:11 发布 · 520 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#TensorFlow #激活函数

激活函数在神经网络中至关重要，引入非线性，解决线性模型的多分类问题。本文详细介绍了Sigmoid、Tanh、ReLU、Swish等函数，包括它们的数学公式、优缺点以及在TensorFlow中的实现。ReLU因运算简单和稀疏性好而广泛应用，但存在死亡神经元问题，衍生出了Leaky ReLU和Elu等变种。Swish函数则被发现比ReLU表现更优。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

激活函数的主要作用就是用来加入非线性因素的，以解决线性模型不能进行多分类的问题，在整个神经网络里起到非常重要的作用。
因为神经网络的数学基础是处处可微的，所以选取的激活函数要能保证数据输入与输出也是可微的。
神经网络中常用的激活函数有Sigmoid、Tanh和Relu等。

1.Sigmoid函数

Sigmoid函数的数学公式为

$f(x)=\tfrac{1}{1+e^{-x}}$

用matplotlib画出Sigmoid函数及其导数的图像

# 在matplotlib中，默认有4个轴，两个横轴和两个竖轴，可以通过ax=plt.gca()方法获取，
# gca是“get current axes”的缩写，即获取图像的轴，这四个轴分别是top，bottom，left和right
# 由于axes会获取到四个轴，而我们只需要两个轴，所以我们需要把另外两个轴隐藏，把顶部和右边的轴的颜色设置为none后，这两个轴将不会显示
# 由于我们要画出Sigmoid函数的及其导数的图像，并且我们还知道Sigmoid值域为(0,1)，所以我们设置y轴的位置为Sigmoid函数y=0的位置，设置x轴的位置为Sigmoid函数x=0的位置
# 
# 
# plt.legend(loc=?,frameon=?)

# loc(设置图例显示的位置)
# 'best'         : 0, (only implemented for axes legends)(自适应方式)
# 'upper right'  : 1,
# 'upper left'   : 2,
# 'lower left'   : 3,
# 'lower right'  : 4,
# 'right'        : 5,
# 'center left'  : 6,
# 'center right' : 7,
# 'lower center' : 8,
# 'upper center' : 9,
# 'center'       : 10,
# 
# ncol(设置列的数量，使显示扁平化，当要表示的线段特别多的时候会有用)
# 
# 
# 

import math
import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(-10,10,100)  # 生成一个x∈[-10,10]且长度为100的等差数列
a = np.array(x)
y1 = 1/(1+math.e**(-a))
y2 = math.e**(-a)/((1+math.e**(-a))**2)
plt.xlim(-11,11)  # 设定x轴范围
plt.ylim(0,1)
ax = plt.gca()    # 获得坐标对象 
ax.spines['right'].set_color('none')
ax.spines['top'].set_color('none')
ax.xaxis.set_ticks_position('bottom') # 设置x轴坐标刻度的位置，在x轴的下面
ax.yaxis.set_ticks_position('left')   # 设置y轴坐标刻度的位置，在y轴的左边
ax.spines['bottom'].set_position(('data',0))
ax.spines['left'].set_position(('data',0))
plt.plot(x,y1,label='Sigmoid',linestyle="-",color="blue")
plt.plot(x,y2,label='Deriv.Sigmoid',linestyle="-",color="red")
plt.legend(['Sigmoid,Deriv.Sigmoid'])               # 显示图例
plt.legend(loc='upper left',frameon=True)  # frameon：默认值True为绘制边框，如果为False则不绘制边框
plt.show()
# plt.savefig('plot_test.png',dpi=500)