一、什么是神经网络?
神经网络复制了人类学习的方式,受我们大脑中神经元如何激发的启发,只是简单得多。
最常见的神经网络由三个网络层组成:
输入层、隐藏层(这是进行特征提取的最重要的层,并进行调整以更快地训练和更好地发挥作用)、输出层
二、关于过拟合
1.问:什么是过拟合?
答:在深度学习过程中,模型对于所提供的数据进行一致性假设而使模型变得过度复杂称为过拟合。白话一点就是说“为了得到一致假设而使假设变得过度严格”
2.问:过拟合带来的危害?
答:“一个过配的模型试图连误差(噪音)都去解释(而实际上噪音又是不需要解释的),导致泛化能力比较差,显然就过犹不及了。”这句话很好地诠释了过拟合带来的危害。具体表现在:深度学习的模型在提供的训练集上效果非常好,但是在未经过训练集观察的测试集上,模型的效果很差,即输出的泛化能力很弱。
3.问:那如何解决过拟合?
过拟合的解决办法很多,目前常用的有以下几种。
(1)获取和使用更多的数据集
(2)采用合适的模型
(3)使用Dropout
(4)权重衰减(Weight-decay)又被称为正则化,具体做法是将权值的大小加入到损失函数中。
(5)Early Stopping,是参数微调中的一种,即在每个