多层感知器与局部模型:原理、应用与算法解析
1. 多层感知器概述
自20世纪80年代中期以来,来自物理学、统计学、心理学、认知科学、神经科学、语言学、计算机科学、电气工程和自适应控制等多个学科的研究人员对人工神经网络模型展开了大量研究。这些研究的协同作用,尤其是统计学和工程学之间的融合,为机器学习领域的发展奠定了坚实基础。
如今,该领域已日趋成熟,目标更加明确和适度。尽管“神经网络”这一术语仍被广泛使用,但人们普遍认识到,像多层感知器这样的神经网络模型实际上是非参数估计器,使用统计方法对其进行分析是最佳选择。
1.1 相关统计方法
投影追踪是一种与多层感知器类似的统计方法,其表达式为:
[y = \sum_{h=1}^{H} \varphi_h(w_h^T x)]
与多层感知器不同的是,投影追踪的每个“隐藏单元”都有自己独立的函数(\varphi_h(\cdot)),而在多层感知器中,所有隐藏单元的激活函数通常固定为Sigmoid函数。
1.2 成功应用案例
多层感知器在自适应控制、语音识别和视觉等领域都有成功的应用。以下是两个值得关注的案例:
- TD - Gammon程序 :Tesauro的TD - Gammon程序使用强化学习训练多层感知器,使其能够以大师级水平进行西洋双陆棋游戏。
- ALVINN神经网络 :Pomerleau的ALVINN神经网络在观察驾驶员五分钟后,能够自主驾驶货车,速度可达每小时20英里。
1.3 练习题解析
以下是一些关于多
超级会员免费看
订阅专栏 解锁全文
2869

被折叠的 条评论
为什么被折叠?



