神经网络技术基础详解
1. 神经网络基础原理
神经网络中的每个神经元都会将输入处理为输出,该输出再与其他神经元相连。部分神经元构成了神经网络的接口,比如有的神经网络有输入信号层和输出信号层。信息从输入层进入网络,各层对信号进行处理,直至其到达输出层。
神经网络的目标是按照预先训练的方式处理信息。训练可采用输入和对应输出的样本数据集,或者由“教师”对网络性能进行评估。神经网络通过学习算法进行训练,刚创建时,它没有任何行为表现,学习算法会调整网络中各个神经元及其连接的权重,使网络表现出期望的行为。
2. 对人类神经细胞的模拟
研究人员分析了多种人类脑细胞模型,这里介绍工业应用中最常用的一种。人类大脑约有$10^{11}$个神经细胞,它们之间约有$10^{14}$个连接。人类神经元有一个内核,外部是电膜,每个神经元都有一个激活水平,其范围在最大值和最小值之间,这与布尔逻辑不同,存在不止两个值。
为了增加或减少神经元的激活水平,存在突触。突触将发送神经元的激活水平传递到接收神经元。兴奋性突触会增加接收神经元的激活水平,抑制性突触则会降低其激活水平。突触不仅在兴奋或抑制接收神经元方面存在差异,其影响程度(突触强度)也不同。每个神经元的输出通过轴突传递,轴突末端最多可形成10000个突触,影响其他神经元。
需要注意的是,这种神经元模型只是对现实的粗略近似,人类无法精确模拟单个神经元,因此基于该简单模型的工作也无法完全复制人类大脑。不过,许多成功的应用证明了基于此简单模型的神经网络的实用性。
3. 神经元的数学模型
基于简单神经元概念有多种数学模型,最常见的如下:
首先,传播函