对于一个机器学习系统,有以下几个问题需要解决:
1,如何选择feature?
2,该选用哪个算法?
3,给这个算法设置怎样的参数?
这些问题合在一起,就是“如何选择模型”的问题。
例如:可以实现分类系统的算法有 one-vs-all logistic regression,neural network,SVM等等,我们该用哪一个。
要解决个这个问题,我们就要用不同的组合(包括算法,参数,feature)对数据D_train进行training,得到不同的model。
要对这些model做测试,需使用新的数据D_cv。然后,对model的分类预测结果做一个评价(如何评价?)
Cross Validation

本文探讨了在机器学习中如何选择模型,主要关注特征选择、算法选取和参数设定。通过介绍交叉验证的概念,如使用训练数据集D_train、测试数据集D_cv,以及K折交叉验证的方法,阐述了如何评估和选择最佳模型。Andrew Ng的建议是将数据分为训练、交叉验证和测试集,并推荐使用5折或10折交叉验证来确保模型的泛化能力。
最低0.47元/天 解锁文章
1190

被折叠的 条评论
为什么被折叠?



