对于一个机器学习系统,有以下几个问题需要解决:
1,如何选择feature?
2,该选用哪个算法?
3,给这个算法设置怎样的参数?
这些问题合在一起,就是“如何选择模型”的问题。
例如:可以实现分类系统的算法有 one-vs-all logistic regression,neural network,SVM等等,我们该用哪一个。
要解决个这个问题,我们就要用不同的组合(包括算法,参数,feature)对数据D_train进行training,得到不同的model。
要对这些model做测试,需使用新的数据D_cv。然后,对model的分类预测结果做一个评价(如何评价?)
Cross Validation