神经网络基础理论

本文介绍了神经网络的基础理论,包括其定义、如何拟合神经网络以及向后传播算法。讨论了训练过程中需要注意的初始值选择、过度拟合、输入规模以及隐单元与隐层的影响。同时,提出了在训练神经网络时,为了防止过度拟合,可以使用验证集,并建议对输入变量进行归一化处理。

机器学习训练营——机器学习爱好者的自由交流空间(入群联系qq:2279055353)

神经网络是什么?

神经网络(Neural Networks)专业术语,涵盖了一大类统计模型和学习算法。在这里,我们介绍最普遍使用的"vanilla"神经网络,有时也称单隐层后向传播网络,或者简称单层感知器(single layer perceptron).
一个神经网络,简单地说,就是一个非线性统计模型。具体地说,一个神经网络是一个两阶段回归或分类模型,也就是说,神经网络可以应用于回归或分类问题。典型的神经网络,用一个示意图表示如下:
在这里插入图片描述
对于回归,通常只有一个因变量,即,神经网络的顶端只有一个输出变量 Y1Y_1Y1. 对于K-类的分类问题,顶端有K个0-1型变量 Y1,Y2,…,YKY_1, Y_2, \dots, Y_KY1,Y2,,YK.

中间层的导出特征 Zm(m=1,2,dots,M)Z_m (m=1,2,dots,M)Zm(m=1,2,dots,M) 由输入 XXX 的线性变换得到,然后目标变量 YkY_kYk 用一个 Z1,…,ZMZ_1,\dots,Z_MZ1,,ZM 的线性组合的函数拟合。

Zm=σ(α0m+αmTX), m=1,2,…,MZ_m=\sigma(\alpha_{0m}+\alpha_m^T X),\, m=1,2,\dots,MZm=σ(α0m+αmTX),m=1,2,,M
Tk=β0k+βkTZ, k=1,2,…,KT_k=\beta_{0k}+\beta_k^T Z,\, k=1,2,\dots,KTk=β0k

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值