24、多层感知机（MLP）：原理、应用与计算过程详解

y9z0a1b

于 2025-09-09 14:57:28 发布

阅读量37

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习基石：从理论到实践文章标签：多层感知机 MLP 感知机

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/y9z0a1b/article/details/152153989

深度学习基石：从理论到实践专栏收录该内容

42 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

多层感知机（MLP）：原理、应用与计算过程详解

1. 多层感知机概述

多层感知机（MLP）作为一种深度学习算法，由Rumelhart在1982年发明，它的出现让神经网络研究从低谷中复苏。MLP的架构包含输入层、隐藏层和输出层，即在输入层和输出层之间增加了一个隐藏层。

MLP适用于各类回归任务和分类任务。其优点是对噪声有较高的容忍度，泛化性能出色；缺点是训练所需时间较长。

MLP还有一些改进的变体：
- 典型的变体是在梯度下降中加入动量项来优化权重。
- 若将MLP应用于时间序列预测，它接收在时间序列数据上滑动的窗口作为输入，这种版本被称为TDNN（时间延迟神经网络）。
- CNN（卷积神经网络）也属于MLP变体，它在MLP基础上增加了特征提取部分。其他变体可通过修改标准MLP的学习过程和架构得到。

2. 感知机

感知机是早期的前馈神经网络，下面从架构、分类过程、学习过程和回归应用四个方面进行介绍。

2.1 架构

感知机由Rosenblatt在20世纪50年代发明，包含输入层和输出层。1982年，Rumelhart通过增加隐藏层将其扩展为MLP。
- 输入层 ：初始输入向量假设为d维向量 $\mathbf{x} = [x_1, x_2, \cdots, x_d]$。输入层的作用是将输入向量原样传递到下一层。第i个输入节点表示为 $I_i = x_i$，由于输入节点的值就是输入值本身，所以通常省略 $I_i$ 的表示，直接用 $x_i$ 表示输入值。
- 输出层 ：每个输出

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。