5.1 神经元模型
定义:
神经网络是由具有适应性的简单单元组成的、广泛并行互连的网络,其组织能够模拟神武神经系统对真实世界物体所做出的交互反应。这里的简单单元指 神经元neuron。
在神经网络中,每个神经元与其他神经元相连,当超过一个”阈值 (threshold)“,该神经元将被激活,产生神经元输出。
沿用至今的M-P神经元模型

5.2 感知机与多层网络
感知机 (perceptron)由两层神经元组成,输入层接收外界输入信号后传递给输出层,输出层是M-P神经元。如下图:

感知机学习规则如下:
对于训练样例 (x, y),若当前感知机输出为, 则按照如下规则调整权重:
为学习率(learning rate)。
感知机只有输出层使用激活函数处理,学习能力有限。通常线性可分linearly separable问题,即存在一个线性超平面可将数据分开,一般可使用感知机算法。
言解决非线性可分问题,需使用多层感知机:
每层神经元与下一层神经元全连接,神经元之间不存在同层内链接,也没有跨层连接,这样的神经网络通常称为”多层前馈神经网络” (multi-layer feedforward neural networks)。比如将下图(b)增加为多层:

5.3 反向传播算法 (BP)
通常说的 “BP网络”指:用BP算法训练的multi-layer feedforward neural network。BP算法基于梯度下降策略,以目标的负梯度方向对参数进行更新。

本文介绍了神经网络的基础,包括M-P神经元模型、感知机与多层网络,重点讲解了反向传播算法(BP)及其解决过拟合的策略。此外,还探讨了RBF网络、ART网络、SOM网络等其他常见神经网络,以及深度学习中的无监督逐层训练和权值共享策略。
最低0.47元/天 解锁文章
1289

被折叠的 条评论
为什么被折叠?



