在我们准备用机器学习构建一个分类器来处理实际问题时,还需要做些其他的准备工作:
1. 根据你的问题选择一种合适的机器学习方法,因为每种机器学习的算法都有各自不同的特点,能适应的场景也不同,所以选择合适的机器学习方法事半功倍。
2. 根据你的问题选择合适的特征来进行分析,因为事物之间都有自己的特征,选择好事物独特的特征来进行也能提高训练效果。
3. 根据你的问题设置合适的分析模型参数,每一种机器学习算法都会依据模型参数设置决策边界。
机器学习的一般步骤可以归纳为两个:
- 训练
- 测试
训练
这一步主要是根据数据确定用于训练的特征向量,然后设置训练的参数,构建分类器模型。
- 为了得到高精度的预测,选择合适的特征是非常重要的。另外,每一种机器学习方法都有各自的特征数据类型的格式,例如算法模型接受(x,y)作为参数,那么有的x,y可能只能是0、1;有的可能是其他的要求。
- 每一种机器学习方法都有一套独特的参数集,如逻辑回归,需要调节的通常只有正则项系数C;如随机森林,需要调节的变量会多出不少;再如神经网络中的神经元个数…在训练的过程中,模型的参数会根据测试的结果不断的被修改和调整,直到找到合适的模型。
测试
根据测试数据集确定用于测试的特征向量,注意,训练和测试的数据集是不同的,然后根据测试结果,选择最佳的模型。
- 同训练数据集同样的特征和同样的模型的参数
在使用机器学习时,训练数据集下的预测效果很好,但是测试集中表现不好的模式有两种:
- 将认为有意义的数据,其实是无意义的干扰数据混到训练数据集
- 根

本文介绍了机器学习应用的基本步骤,包括选择合适的机器学习方法、特征选择、模型参数设置以及训练和测试过程。强调了训练和测试数据集的独立性,以及过拟合问题在模型泛化能力中的重要性。
最低0.47元/天 解锁文章
17万+

被折叠的 条评论
为什么被折叠?



