深度学习模型构建面临的问题及“吴恩达”的建议

在深度学习模型构建中,吴恩达建议先建立简单模型并用学习曲线判断高偏差或高方差。关注F1Score平衡准确率与召回率。数据集通常划分为60%训练集、20%交叉验证集和20%测试集。PCA用于提升训练速度,不应急于优化。K-Means聚类的K值选择应结合实际应用目的。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

关于模型搭建
  • 在一开始,尽量不要将问题复杂化(不要提前优化),先快速实现一个简单算法,然后通过交叉验证集评估模型。这就好比在软件工程中,不会做提前优化,而是先迭代功能。
  • 通过绘制学习曲线(learning curve),确定面临的问题是高偏差还是高方差,来决定是添加更多训练样本,还是添加更多特征。
  • 甚至可以手动检查交叉验证集中误差较大的样本,确定错误的来源和解决策略。
关于准确率与召回率的权衡

我们希望有一个指标能选出查准率和召回率都高的算法,为此,引入了 F1Score :
这里写图片描述

关于数据集的划分
  • 训练集60%
  • 交叉验证集20%
  • 测试集20%
关于PCA的使用

不要提前优化

在机器学习中,一定谨记不要提前优化,只有当算法运行效率不尽如人意时,再考虑使用 PCA 或者其他特征降维手段来提升训练速度。

关于聚类K值的选择

一般来说,K-Means 得到的聚类结果是服务于我们的后续目的(如通过聚类进行市场分析),所以不能脱离实际而单纯以数学方法来选择 K 值。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

声纳咸鱼の声学实验室

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值