机器学习中最有价值的部分是预测建模。 这是对历史数据进行训练并对新数据进行预测的模型的开发。 当涉及到预测建模时,首要的问题是:怎样才能获得更好的结果?
这份备忘单包含我从多年来我自己的应用程序和研究顶级机器学习从业者和竞赛获胜者中提炼出的最佳建议。 使用本指南,您不仅可以提升性能,甚至可以在预测问题上获得世界一流的结果。
指南分为 4 个子主题:
1. 用数据提高性能。
2. 用算法提高性能。
3. 通过调优提高性能。
4. 使用集成提高性能。
列表中越往下,收益通常越小。 例如,问题的新框架或更多数据通常比调整性能最佳算法的参数会给您带来更多收益。 虽然并非总是如此,但一般而言是这样的。
1、使用数据提高性能
&n