如何判断欠拟合、适度拟合、过拟合

可以通过查看训练集误差和验证集误差,从而判断算法达到什么效果。通过衡量训练集和验证集的误差就可以得出不同结论。

1.欠拟合:

假定训练集误差是 15%,验证集误差是 16%。这样则说明算法并没有在训练集中得到很好的训练,如果训练集数据的拟合度不高,就是数据欠拟合,就可以说这种算法偏差比较高。也就是我们说的没有训练好。
相反,它对于验证集产生的结果是合理的,验证集中的错误率只比训练集的多了 1%,所以这种算法偏差高,因为它甚至不能拟合训练集。就更别提验证集了。

训练集和验证集的误差都较高,但相差很少——>欠拟合

2.适度拟合

训练集误差是 0.5%,验证集误差是 1%,这样的结果偏差和方差都很低,说明训练效果很好,这是我们想要的结果。

训练集和验证集的误差都很低——>适度拟合

3.过拟合

假定训练集的误差是 1%,验证集误差是 11%,可以看出训练集训练的非常好,而验证集很差,从而可以判断可能过度拟合了训练集,在某种程度上,验证集并没有充分利用交叉验证集的作用,这就是过拟合现象,也称为“高方差”。

训练集误差较低,验证集误差比训练集大较多——>过拟合

4.最差的情况

训练集误差是 15%,偏差相当高,但是,验证集的评估结果更糟糕,错误率达到 30%,这样说明算法偏差高,因为它在训练集上结果不理想,而且方差也很高,这是方差偏差都很糟糕的情况。这是我们最不想看到的情况。

参考:吴恩达的深度学习视频

作者:GL3_24
来源:优快云
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

### 深度学习中过拟合拟合的概念 在深度学习领域,模型的表现可以分为三种情况:过拟合拟合以及适度拟合。当模型既能在训练集上取得良好效果,在测试集上也能保持稳定性能时,则认为达到了适度拟合的状态。 对于过拟合而言,指的是模型对训练数据的学习过于精细以至于记住了噪声和其他不重要的细节,从而导致其泛化能力下降,在未见过的数据上的预测准确性降低[^1]。而拟合则是指模型未能充分捕捉到输入特征与目标变量之间的关系,使得无论是在训练还是验证阶段都表现出较差的成绩[^2]。 ### 判断标准 - **拟合**:如果一个模型在训练集和测试集上的误差都很高,那么这个模型可能处于拟合状态。 - **过拟合**:相反地,若某模型仅在训练集中有较低错误率而在独立样本(如交叉验证集或测试集)里却显示出较高偏差,则表明该网络发生了过拟合现象。 - **适度拟合**:理想情况下,希望找到一种平衡点使我们的算法既能很好地适应已知实例又能合理推测未知案例。 ### 导致的原因 #### 过拟合原因 - 数据量不足:有限数量的例子不足以支撑复杂函数空间的有效探索; - 特征维度过多:存在大量冗余属性增加了不必要的参数估计难度; - 正则约束不够强:缺乏有效的惩罚机制来抑制权重增长; #### 拟合原因 - 学习速率设置不当:过高会跳过全局最小值附近区域,太低又难以收敛至最优解; - 网络结构简单:隐藏层节点数太少无法表达复杂的映射规律; - 初始化方式不合理:某些极端初始值可能会阻碍梯度传播过程正常进行; ### 解决策略 针对上述两种异常状况有不同的处理手段: #### 应对过拟合的方法 ##### L2正则化 通过向损失函数添加一项关于权值平方和的形式,鼓励较小绝对值的系数分布,有助于减少过拟合风险。 ```python weight_decay = 0.01 # 调整此超参控制强度 criterion = nn.CrossEntropyLoss() optimizer = optim.SGD(model.parameters(), lr=learning_rate, weight_decay=weight_decay) ``` ##### Dropout随机失活 每次迭代过程中按照一定概率丢弃部分神经元连接,迫使其他路径承担更多责任,提高整体鲁棒性和抗干扰性。 ```python dropout_prob = 0.5 # 设置丢失比例 model = nn.Sequential( ..., nn.Dropout(p=dropout_prob), ... ) ``` #### 应对拟合的办法 增加模型容量是最直接有效的方式之一,比如加深层数或者拓宽每层宽度以增强表征力。除此之外还可以尝试调整优化器配置文件里的各项参数直至获得满意的结果为止[^3]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值