基于Keras实现多层感知器(MLP)进行图像分类
1. 多层感知器(MLP)架构概述
1.1 回归MLP架构
回归任务中,MLP的典型架构超参数设置如下表所示:
| 超参数 | 典型值 |
| — | — |
| 输入神经元数量 | 每个输入特征对应一个神经元(例如,MNIST数据集中为28 x 28 = 784) |
| 隐藏层数量 | 取决于问题,通常为1到5层 |
| 每个隐藏层的神经元数量 | 取决于问题,通常为10到100个 |
| 输出神经元数量 | 每个预测维度对应一个神经元 |
| 隐藏层激活函数 | ReLU(或SELU) |
| 输出层激活函数 | 无,或ReLU/softplus(如果输出为正)或logistic/tanh(如果输出有界) |
| 损失函数 | MSE或MAE/Huber(如果存在异常值) |
1.2 分类MLP架构
MLP也可用于分类任务,根据分类类型不同,架构有所差异,具体如下:
- 二元分类 :单个输出神经元,使用logistic激活函数,输出值在0到1之间,表示正类的估计概率。损失函数通常使用交叉熵。
- 多标签二元分类 :每个标签对应一个输出神经元,均使用logistic激活函数。同样使用交叉熵作为损失函数。
- 多类分类 :每个类别对应一个输出神经元,使用softmax激活函数,确保所有估计概率在0到1之间且总和为1。损失函数也是交叉熵。
典型分类ML
超级会员免费看
订阅专栏 解锁全文
5692

被折叠的 条评论
为什么被折叠?



