机器学习/深度学习入门：基本问题

最新推荐文章于 2024-02-29 22:30:00 发布

M_Z_G_Y

最新推荐文章于 2024-02-29 22:30:00 发布

阅读量647

点赞数

分类专栏：机器学习/深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/M_Z_G_Y/article/details/80620120

版权

本文介绍了机器学习和深度学习中常见的问题，包括过拟合、欠拟合及其解决办法，如正则化、Dropout技术。过拟合是模型对训练数据过度学习，欠拟合则是模型未能充分捕捉数据特征。Dropout通过随机屏蔽神经元防止过拟合，正则化通过参数约束简化模型。L1和L2正则化分别通过产生稀疏模型和权重平滑来防止过拟合。此外，还讨论了偏差和方差以及梯度消失、梯度爆炸的解决策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

过拟合，欠拟合和相应的解决办法

欠拟合：模型没有很好地捕捉到数据特征，不能够很好地拟合数据.
解决办法：

模型复杂化
增加更多的特征，使输入数据具有更强的表达能力
降低正则化约束

过拟合：模型把训练集数据学习的太彻底，在验证和测试集上准确率低，即模型的泛化能力差。
解决办法：

增加训练数据数
减少特征数
降低模型的复杂度
使用正则化约束
使用Dropout
提前结束训练（全局平均池化（因为不需要进行参数优化），1*1卷积（减少计算量，在某种程度上避免过拟合））

Dropout

流程：

让某个神经元以概率p停止工作，其实就是让它的激活函数值以概率p变为0。
把输入一小批训练样本通过修改后的网络前向传播，然后把得到的损失结果通过修改的网络反向传播并更新修改后的网络层。
恢复被删掉的神经元（此时被删除的神经元保持原样，而没有被删除的神经元已经有所更新），不断重复上述过程。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。