机器学习项目流程

1. 理解业务,根据业务目标确定评估标准,如Accuracy, Precision, Recall, running time等。评估标准将用于评估training set, test set 和 validation set。

2. 数据预处理(特征工程),数据清洗,数据补全,维度变换,提取有用特征,等。

3. 分割Train/test/validation(hold out) set, 对多个分布的数据,每个分布均提取train/test/validation set,保证train/test/validation set同分布。1M数据,分割比约为 Train : test : validation = 98% : 1% :1% 。

4. 确定同类问题判断(如分类问题)的人类水平,和理想情况下的贝叶斯最优误差。将人类水平分类为标准个人,标准专家,资深专家,资深专家组等,分析人类水平的bias和variance,目的是使accuracy大于人类水平。

5. 训练提升模型表现,使用更大模型,调参, regularization, 神经网络架构/参数调优,获取更多数据,模型融合等。

6. test set和validation set 评估模型并进行误差分析,清理错误数据,快速发布系统并迭代。

本文参考:

【1】 deep-learning spetializtion: structuring machine learning projects ------Deeplearning.AI

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

liskol

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值