神经网络基础理论

最新推荐文章于 2024-08-21 10:35:28 发布

原创

最新推荐文章于 2024-08-21 10:35:28 发布 · 3.3k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习

本文介绍了神经网络的基础理论，包括其定义、如何拟合神经网络以及向后传播算法。讨论了训练过程中需要注意的初始值选择、过度拟合、输入规模以及隐单元与隐层的影响。同时，提出了在训练神经网络时，为了防止过度拟合，可以使用验证集，并建议对输入变量进行归一化处理。

机器学习训练营——机器学习爱好者的自由交流空间（入群联系qq：2279055353）

神经网络是什么？

神经网络(Neural Networks)专业术语，涵盖了一大类统计模型和学习算法。在这里，我们介绍最普遍使用的"vanilla"神经网络，有时也称单隐层后向传播网络，或者简称单层感知器(single layer perceptron).
一个神经网络，简单地说，就是一个非线性统计模型。具体地说，一个神经网络是一个两阶段回归或分类模型，也就是说，神经网络可以应用于回归或分类问题。典型的神经网络，用一个示意图表示如下：
在这里插入图片描述
对于回归，通常只有一个因变量，即，神经网络的顶端只有一个输出变量 $Y_1$ . 对于K-类的分类问题，顶端有K个0-1型变量 $Y1,Y2,…,YKY_1, Y_2, \dots, Y_K$ .