机器学习训练营——机器学习爱好者的自由交流空间(入群联系qq:2279055353)
神经网络是什么?
神经网络(Neural Networks)专业术语,涵盖了一大类统计模型和学习算法。在这里,我们介绍最普遍使用的"vanilla"神经网络,有时也称单隐层后向传播网络,或者简称单层感知器(single layer perceptron).
一个神经网络,简单地说,就是一个非线性统计模型。具体地说,一个神经网络是一个两阶段回归或分类模型,也就是说,神经网络可以应用于回归或分类问题。典型的神经网络,用一个示意图表示如下:

对于回归,通常只有一个因变量,即,神经网络的顶端只有一个输出变量 Y1Y_1Y1. 对于K-类的分类问题,顶端有K个0-1型变量 Y1,Y2,…,YKY_1, Y_2, \dots, Y_KY1,Y2,…,YK.
中间层的导出特征 Zm(m=1,2,dots,M)Z_m (m=1,2,dots,M)Zm(m=1,2,dots,M) 由输入 XXX 的线性变换得到,然后目标变量 YkY_kYk 用一个 Z1,…,ZMZ_1,\dots,Z_MZ1,…,ZM 的线性组合的函数拟合。
Zm=σ(α0m+αmTX), m=1,2,…,MZ_m=\sigma(\alpha_{0m}+\alpha_m^T X),\, m=1,2,\dots,MZm=σ(α0m+αmTX),m=1,2,…,M
Tk=β0k+βkTZ, k=1,2,…,KT_k=\beta_{0k}+\beta_k^T Z,\, k=1,2,\dots,KTk=β0k

本文介绍了神经网络的基础理论,包括其定义、如何拟合神经网络以及向后传播算法。讨论了训练过程中需要注意的初始值选择、过度拟合、输入规模以及隐单元与隐层的影响。同时,提出了在训练神经网络时,为了防止过度拟合,可以使用验证集,并建议对输入变量进行归一化处理。
最低0.47元/天 解锁文章
3139

被折叠的 条评论
为什么被折叠?



